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轩 本 书 提 出 了 以 理解 和 运用 计算 生态 为 目标 的 Python 语言 教学 思想 和 学 习 路 径 。 

站 与 传统 编程 语言 学 习 不 同 ; 本 书 不 仅 强调 学 习 Python 语 言 的 基本 语法 , 同时 强调 
掌握 运用 Python 遂 数 库 的 能 力 。 

由 本 书 绝 大 部 分 实例 将 令 人 激动 , 原来 编程 可 以 这 么 有 趣 | 
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本 书 提出 了 以 理解 和 运用 计算 生态 为 目标 的 Python 语言 教学 思想 ， 
在 系统 讲解 Python 语言 语法 的 同时 介绍 了 从 数据 理解 到 图 像 处 理 的 14 个 
Python 函数 库 ， 向 初学 Python 语言 的 读者 展示 了 全 新 的 编程 语言 学 习 路 
径 。 全 书 一 共 设 计 了 25 个 非常 具有 现代 感 的 实例 ， 从 绘制 蟒蛇 、 理解 天 
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内 容 深 入 不 断 激发 读者 学 习 Python 语言 的 热情 ， 因 为 “编程 是 件 很 有 趣 
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数学 课程 资源 使 用 说 明 


与 本 书 配套 的 数字 课程 资源 发 布 在 高 等 教育 出 版 社 易 课 程 网 站 ， 请 登录 网 站 后 开始 课程 
学 习 。 


一 、 注 册 / 登 录 

访问 http://abook.hep.com.cn/1865445， 点 击 “ 注 册 ”， 在 注册 页 面 输入 用 户 名 、 密 码 及 常 
用 的 邮箱 进行 注册 。 已 注册 的 用 户 直接 输入 用 户 名 和 密码 登录 即 可 进入 “我 的 课程 ”页 面 。 

二 、 课 程 绑 定 

点 击 “ 我 的 课程 ”页 面 右上 方 “ 绑 定 课程 >， 正 确 输 入 教材 封底 防伪 标签 上 的 20 位 密码 ， 
点 击 “ 确 定 ” 完 成 课程 绑 定 。 

三 、 访 问 课 程 

在 “正在 学 习 ” 列 表 中 选择 已 绑 定 的 课程 ， 点 击 “ 进 入 课程 ” 即 可 浏览 或 下 载 与 本 书 配 
套 的 课程 资源 。 刚 绑 定 的 课程 请 在 “申请 学 习 ” 列 表 中 选择 相应 课程 并 点 击 “ 进 入 课程 ”。 

四 、 与 本 书 配套 的 易 课 程 数字 课程 资源 包括 案例 素材 ， 以 便 读 者 学 习 使 用 
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五 、 资 源 使 用 


与 本 书 配 套 的 易 课 程 数 字 课 程 资 源 按照 章 、 节 知识 树 的 形式 构成 , 包括 电子 教案 MOOC 
课程 、 源 代码 、 阶 段 测 试 、 程 序 设计 、 程 序 练习 、 图 片 资料 、 彩 图 素材 、 程 序 素 材 等 内 容 的 
资源 ， 以 便 读 者 学 习 使 用 。 


1. 电子 教案 : 教师 上 课 使 用 的 与 课程 和 教材 紧密 配套 的 教学 PPT， 可 通过 二 维 码 扫描 观 
看 ， 以 便 学 生 课 前 预习 或 课 后 复习 使 用 ， 也 可 供 教师 下 载 使 用 。 


2.， MOOC 课程 : 提供 本 书 编者 开设 在 中 国 大 学 MOOC 上 的 “Python 语言 程序 设计 ” 课 
程 的 外 链 ， 学 生 通过 扫描 二 维 码 即 可 观看 。 


3. 源 代码 、 阶 段 测试 、 程 序 设 计 、 程 序 练习 : 本 书 所 配套 的 与 代码 相关 的 练习 ， 均 可 通 
过 扫描 书 中 边栏 的 二 维 码 进入 编者 团队 设计 开发 的 Python123 平台 查看 和 运行 。 也 可 通过 扫 
描 前 勒 口 处 的 二 维 码 进 入 平台 。 


4. 图 片 资 料 : 针对 函数 库 的 相关 属性 和 知识 点 ， 本 书 提供 快速 参考 索引 ， 学 生 可 通过 扫 
描 书 中 边栏 的 二 维 码 获 取 ， 以 便 帮 助 学 生 增进 理解 ， 加 深 印 象 。 


5. 彩 图 素材 、 程 序 素材 : 提供 与 知识 点 相关 的 彩 图 和 程序 素材 。 
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本 书 是 在 国内 外 广泛 关注 且 推 进 “ 计 算 思 维 ” 教 学 理念 的 大 背景 下 编写 的 ， 在 该 书 成 稿 
之 时 ， 如 何 将 “计算 思维 ”理念 转化 为 大 学 计算 机 基础 课程 的 教学 内 容 仍 处 于 探讨 中 。 无 论 
“计算 思维 ”的 内 涵 和 外 延 如 何 ， 具 有 “计算 思维 ”的 学 习 者 应 该 能 够 深刻 理解 问题 的 计算 特 
性 并 善于 利用 计算 机 解决 问题 。 本 书 以 此 为 出 发 点 ， 期 望 实现 两 个 目标 : 使 读者 掌握 一 门 终 
身受 用 的 程序 设计 语言 (Python 语言 ); 使 读者 体验 利用 程序 设计 语言 解决 实际 问题 的 过 程 和 
思路 。 

选择 Python 语言 作为 “终身 受用 的 程序 设计 语言 ”来 教学 并 非 因 为 作者 在 10 年 前 就 接 
触 并 使 用 它 ， 而 是 因为 Python 语言 是 一 种 简洁 且 强 大 的 语言 。 相 比 其 他 高 级 语言 ， 它 的 语法 
简洁 质朴 ， 可 以 用 优美 来 形容 。 最 关键 的 ， 它 是 一 种 开源 的 脚本 语言 ， 这 个 特点 促使 世界 上 
出 现 了 最 大 的 围绕 Python 程序 设计 的 开放 社区 。 至 今 ， 该 社区 已 经 提供 了 超过 3 万 个 不 同 功 
能 的 开源 函数 库 ， 为 基于 Python 语言 的 快速 开发 提供 了 强大 支持 。 

超凡 脱俗 、 简 洁 优美 、 功 能 强大 、 跨 各 种 平台 、 经 济 实 惠 等 词语 都 可 以 用 来 形容 Python 
语言 ， 但 这 些 还 不 够 ，Python 语言 是 仅 次 于 C 语言 的 第 二 语言 。 而 更 通常 的 情况 是 ， 如 果 程 
序 不 是 以 执行 性 能 为 首要 设计 目标 ，Python 语言 是 首选 。 

Python 语言 是 一 门 非常 简单 易学 的 语言 。 作 者 曾经 设计 过 “1 小 时 学 Python” 的 教学 实 
验 ， 实 践 证 明 ， 大 多 数 没有 任何 程序 设计 基础 的 大 一 学 生 都 可 以 在 1 小 时 内 理解 Python 设计 
方法 并 具备 十 几 行 代码 的 编写 能 力 。 这 曾 让 作者 既 喜 且 忧 ， 喜 在 学 生 们 似乎 找到 了 一 种 简单 
易学 、 编 写 快速 并 能 解决 问题 的 合适 语言 ， 忧 在 至 今 Python 语言 还 没有 进入 大 学 计算 机 基础 
课程 的 教学 计划 。 本 书 是 一 个 尝试 ， 希 望 更 多 同行 关注 Python 语言 ， 在 大 学 计算 机 基础 课程 
教学 中 讲授 Python 语言 ， 让 学 生 们 终身 受益 。 

本 书 具 有 较 强 的 现代 气息 ， 书 中 所 涉及 的 问题 不 仅 包 括 房屋 贷款 计算 ， 还 包括 PM2.5 雾 
者 预 警 、 贺 周 率 计算 、GPS 定位 和 科 替 曲线 (分 形 几何 ) 等 ,读者 在 解决 一 个 个 问题 的 同时 
一 定 不 会 觉得 乏味 ， 因 为 这 些 问 题 就 在 身边 。 为 了 配合 读者 学 习 或 高 校 教师 开展 Python 语 
言 教学 ， 本 书 通过 配套 网 站 提供 电子 资源 ， 网 址 为 http:Wwww.python123.org， 内 容 包 括 教 学 
用 PPT、 更 多 习题 和 答案 、 更 多 程序 设计 问题 和 实例 、 在 线程 序 测试 平台 、 读 者 在 线 问题 解 
答 等 。 

北京 理工 大 学 计算 机 学 院 李 凤 霞 教授 是 本 书 的 主 审 ， 她 的 直觉 、 害 智和 丰富 经 验 启 发 了 
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作者 对 教学 Python 程序 设计 语言 的 思路 。 还 要 感谢 在 本 书 撰写 和 出 版 过 程 中 给 予 帮助 的 人 ， 
包括 研究 生 史 湘 君 、 骆 世 瑛 、 徐 金 楠 、 万 云 饥 、 李 玮 、 陈 潇 、 张 运 大 、 刘 盏 和 易 琳 等 ， 以 及 
北京 理工 大 学 教师 孙 新 ， 他 们 对 本 书 部 分 段落 和 例子 都 有 实际 贡献 。 本 书 得 到 了 北京 市 教育 
委员 会 “北京 高 等 学 校 青年 英才 计划 项 目 ” 的 资助 ， 在 此 一 并 感谢 。 限 于 水 平 ， 书 中 不 足 之 
处 在 所 难免 ， 敬 请 读者 和 同行 批评 指正 。 作 者 的 电子 邮件 地 址 是 songtian@bit.edu.cn. 
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一 一 Python 语言 是 什么 ? 它 只 是 其 他 编程 语言 的 蔡 代 品 吗 ? 

一 一 不 ，Python 是 一 种 生态 语言 。 

地 球 几 十 亿 年 的 生命 孕育 出 丰富 多 彩 的 自然 生态 ， 物 竞 天 择 ， 依 存 繁衍 。 计 算 机 70 余年 
的 发 展开 创 了 一 个 释放 全 球 智力 、 激 发 创新 热情 的 开源 共享 的 信息 时 代 。 随 着 专业 分 工 和 知 
慧 角逐 的 深入 ， 各 信息 技术 分 支 逐 渐 形 成 了 一 批 以 开源 共享 为 形态 的 开放 资源 ， 包 括 开 源 操 
作 系 统 、 数 据 库 、 软 件 工 具 其 至 开源 硬件 ， 构 成 了 “计算 生态 ”。 与 自然 生态 类 似 ,计算 生态 
并 没有 顶层 设计 ， 而 是 获 益 于 草根 工程 师 或 一 线 专 家 无 私 贡献 的 专业 智慧 。 计 算 生 态 中 的 各 
元 素 在 竞争 中 发 展 、 依 存 、 终 结 、 再 生 ， 成 为 信息 技术 快速 发 展 最 重要 的 创新 动力 。 

Python 语言 在 计算 生态 的 大 背景 下 诞生 、 发 展 、 再 生 ， 历 时 近 30 年 ， 其 简洁 和 面向 生态 
的 设计 理念 得 到 了 广泛 认同 ， 形 成 了 全 球 范 围 最 大 的 单一 语言 编程 社区 。 超 过 9 万 个 第 三 方 
编程 库 覆 盖 从 数据 到 智能 、 二 维 到 三 维 、 文 本 处 理 到 虚拟 现实 、 控 制 塑 辑 到 系统 结构 等 几乎 
所 有 的 计算 领域 。 最 为 可 贵 的 是 ，Python 语言 能 够 将 其 他 编程 语言 的 优秀 成 果 封 装 起 来 ， 降 
低 使 用 复杂 度 。 因此， 我 们 称 Python 语言 为 “生态 语言 ”。 

本 书 在 国内 高 校 广泛 接触 并 关注 Python 语言 教学 的 大 背景 下 编写 ， 试 图 从 计算 技术 发 展 
角度 阐释 Python 语言 作为 “生态 语言 ”的 价值 ， 展 示 一 条 与 其 他 编程 语言 不 同 的 学 习 路 径 。 
具体 来 说 ， 本 书 设 计 了 超过 20 个 利用 第 三 方 库 的 编程 实例 ， 伴 随 Python 语言 语法 讲解 了 10 
余 个 标准 库 或 第 三 方 库 的 使 用 ， 在 讲解 程序 设计 基础 概念 、Python 语言 语法 的 同时 ， 帮 助 读 
者 理解 围绕 计算 生态 开展 编程 并 解决 问题 的 基本 理念 和 方法 。 

“理解 运用 计算 生态 ， 培 养 集成 创新 思维 ”是 我 们 期 望 传达 的 教学 理念 。 本 书 以 此 为 出 发 
点 ， 试 图 实现 两 个 目标 : 使 读者 掌握 一 门 终身 受用 的 编程 语言 (Python 语言 ); 使 读者 体验 运 
用 计算 生态 解决 实际 问题 的 过 程 和 思路 。 期 待 读者 能 通过 Python 语言 的 学 习 ， 真 正 走 进 计 算 
世界 ， 享 受 创新 的 乐趣 ! 

本 书 成 稿 过 程 一 波 三 折 ， 先 后 历时 一 年 ， 随 着 教学 理念 的 不 断 发 展 完 善 以 及 教学 经 验 的 
积累 ， 本 书 大 部 分 内 容 被 推翻 或 重 写 过 多 次 ， 本 书 超过 90% 的 实例 都 是 作者 原创 。 此 外 ， 借 
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第 一 部 分 ” 初 识 Python 语音 


本 部 分 主要 讲解 初 识 Python 语言 的 那些 事 儿 ， 让 读者 能 够 快速 入 门 ， 跨越 那 段 
最 滕 腌 、 最 期 待 的 未 知 地 带 ， 了 解 Python 语言 的 基本 概念 并 建立 对 程序 设计 方法 的 
基本 理解 。 这 一 部 分 的 学 习 目标 是 编写 10 行 左右 的 Python 程序 。 

本 部 分 包括 3 章 内 容 (第 1、2 章 和 附录 A )， 分 别 如 下 : 

第 1 章 程序 设计 基本 方法 

第 2 章 Python 程序 实例 解析 

附录 A 极 简 计算 机 基础 


第 1 章 主要 面向 初学 编程 语言 的 读者 ， 重 点 讲解 编写 程序 最 基本 的 IPO 方法 ， 
介绍 Python 语言 安装 和 运行 过 程 ， 说 明 Python 语言 的 版 本 更 迭 和 选择 。 

第 2 章 讲 解 两 个 Python 程序 实例 ， 围 绕 实例 介绍 Python 语言 的 语法 元 素 和 编 
程 模式 ， 帮 助 读者 建立 Python 语言 编程 的 总 体 概 念 。 

附录 A 补充 介绍 编写 程序 所 需要 了 解 的 计算 机 基础 概念 ， 从 数据 到 万 维 网 ， 从 
存储 程序 结构 到 虚拟 化 ， 采 用 极 简 令 述 方式 撰写 ， 适 合 读者 在 学 习 本 书 内 容 时 复习 
参考 。 

对 于 初学 程序 设计 的 读者 , 除 附 录 A 作为 参考 外 , 建议 按照 章节 顺序 逐步 学 习 。 
对 于 有 一 定 程序 设计 基础 但 不 熟悉 Python 语言 的 读者 ， 建 议 了 解 Python 语言 安装 
环境 后 重点 学 习 第 2 章 内 容 。 由 于 附录 A 采用 极 简 叙述 方式 撰写 ， 可 以 作为 读者 的 
阅读 资料 。 
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医 训 个 国策 ， 每 个 人 前 应 磅 学 习 如 朵 编队 ， 区 全 疙 信条 个 考 。 
Everybody in this country should learn how to program a computer, because it 


teaches you how to think. 


史 带 夫 。 乔 布 斯 (Steve Jobs) 
苹果 公司 创始 人 


[Os es 
学 习 目 标 : 


1 (1) 理解 硬件 和 软件 在 计算 机 系统 中 的 不 同 作用 。 

! (2) 了 解 程序 设计 语言 的 发 展 过 程 。 

! (3) 理解 Python 语言 的 特点 以 及 其 重要 性 。 

1 (4) 掌握 Python 语言 Hello 程序 的 编写 方法 。 

1 《5) 掌握 Python 语言 开发 和 运行 环境 的 配置 方法 。 

' (6) 理解 编写 程序 的 IPO 方法 。 

! (7) 了 解 Python 版 本 更 迭 过 程 和 新 旧版 本 的 主要 区 别 。 


ECS 


SS 


Hello World 是 1978 年 Brian Kernighan 经 典 著 作 《C 程序 设计 语言 》 的 第 一 个 
例子 。 这 段 简 短 的 代码 逐渐 演变 成 了 具有 特殊 象征 意义 的 里 程 碑 。 时 至 今日 ， 这 个 
程序 几乎 是 每 门 编程 语言 中 不 可 蔡 代 的 首 个 程序 。 接 下 来 ,读者 将 看 到 如 何 用 Python 
语言 来 编写 简洁 优美 且 跨 平台 的 Hello World 程序 。 

向 计算 机 世界 发 出 你 的 问候 吧 ! 
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1.1 计算 机 的 概念 


“es 


计算 机 ， 不 可 否认 ， 是 人 类 最 伟大 的 发 明之 一 。 

“Computer”， 最 初 指 专门 负责 计算 的 人 ， 到 了 20 世纪 中 期 逐渐 演变 为 计算 
设备 ， 当 代 特 指 计算 机 。 

计算 机 的 故事 要 从 人 类 始 于 久远 但 延续 至 今 的 计算 需求 说 起 。 人 类 为 何 需要 计 
算 ? 很 显然 ， 人 类 在 敬 晨 自然、 认识 自然 甚至 试图 驾驭 自然 的 过 程 中 ， 为 了 认识 
然 现象 、 分 析 自 然 规律 ， 需 要 进行 量化 计算 ， 人 类 社会 对 有 限 资源 的 分 配 、 对 人 类 
活动 的 有 效 管理 ， 需 要 进行 优化 计算 ; 人 类 探索 思维 空间 的 数学 、 逻 辑 和 哲学 问题 ， 
需要 进行 推理 演算 。 到 了 21 世纪 ， 人 类 间 便 捷 和 高 效 的 通信 需求 推动 了 网 络 计算 的 
发 展 ， 计 算 需 求 已 经 深入 到 人 类 的 日 常生 活 中 ， 无 处 不 在 。 

求解 计算 问题 的 方法 由 计算 科学 来 研究 ， 具 体 的 计算 任务 由 计算 设备 来 完成 。 
广义 上 讲 ， 计 算 设 备 包 含 但 不 限 计 算 机 。 

计算 机 的 定义 有 很 多 种 ， 如 下 定义 更 符合 计算 机 的 本 质 : 计算 机 是 根据 指令 操 
作 数 据 的 设备 (A computer is a machine that manipulates data according to a list of 
instructions)。 从 定义 可 以 看 出 ， 计 算 机 有 两 个 基本 特性 : 功能 性 和 可 编程 性 。 功 能 
性 指 对 数据 的 操作 ， 表 现 为 数据 计算 、 输 入 输出 处 理 和 结果 存储 等 。 可 编程 性 指 它 
可 以 根据 一 系列 指令 自动 地 、 可 预测 地 、 准 确 地 完成 操作 者 的 意图 。 

理解 计算 机 应 该 结合 计算 机 的 两 个 特性 。 只 要 设备 具备 了 计算 的 功能 性 和 操作 
的 可 编程 性 ， 就 可 以 看 作 是 计算 机 。 判 断 一 个 计算 设备 是 否 属 于 计算 机 并 不 依靠 其 
制造 材质 ， 计 算 机 不 一 定 是 电子 的 。 例 如 ， 计 算 机 前 沿 领域 的 光 计 算 机 、 量 子 计算 
机 、 超 导 计 算 机 、 生 物 计算 机 等 新 形态 计算 机 都 不 是 建立 在 电子 学 基础 上 ， 但 它们 
都 表达 了 计算 机 的 概念 , 也 属于 计算 机 类 别 。 除 特殊 说 明 外 , 本 书后 续 内 容 中 的 “ 计 
算 机 ” 均 指 电子 计算 机 。 

计算 机 技术 发 展 主要 围绕 计算 机 的 功能 性 和 可 编程 性 展开 。 一 方面 ， 计 算 机 硬 
件 所 依赖 的 集成 电路 规模 按照 摩尔 定律 以 指数 方式 增长 ， 计 算 机 运行 速度 也 接近 几 
何 级 数 快速 增加 ， 计 算 机 所 能 高 效 支 撑 的 功能 不 断 丰 富 发 展 。 另 一 方面 ， 表 达 计 算 
机 可 编程 性 的 程序 设计 语言 也 在 经 历 从 机 器 语言 .汇编 语言 到 高 级 语言 的 发 展 过 程 ， 
并 逐步 朝 着 更 接近 自然 语言 的 方向 发 展 。 

拓展 : 摩尔 定律 
， 摩尔 定律 (Moore's Law ) 是 计算 机 发 展 历 史上 最 重要 的 预测 法 则 ， 注 意 ， 它 ， 
不 是 物理 或 自然 法 则 ， 它 由 英特尔 (Intel ) 公司 创始 人 之 一 总 登 -摩尔 (Gorden E. ， 


ee eed 
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“Moore ) 于 1965 年 提出 的 。 摩 尔 定律 指出 ， 单 位 面积 集成 电路 上 可 容纳 晶体 管 的 ， 
' 数量 约 每 两 年 翻 一 售 ， 十 于 计算 机 中 几乎 所 有 的 重要 部 件 ， 例 如 ，CPU、 内 存 、 

| 硬盘、 网 络 接口 等 ， 都 由 集成 电路 实现 ， 摩 尔 定律 实际 上 揭示 了 1965 年 至 今 仍 ， 
在 高 如 发 民 的 半导体 技术 趋势 ， 进 而 ， 摩 尔 定律 成 为 计算 机 性 能 水 平 的 一 个 重要 
, 预测 法 则 。 | 
| 如 果 穿 越 时 间 回 到 1965 年 ， 计 算 机 还 只 是 科学 研究 装置 ， 不 仅 如 此 ， 当 时 | 
| 计算 器 尚未 诞生 (第 一 个 便携 式 电子 计算 器 在 1970 年 才 诞生 ) 摩尔 定律 所 预测 ， 
' 的 晶体 管 数量 及 所 表达 的 计算 机 性 能 指数 发 展 趋势 邻 人 十 分 震撼。 技术 发 展 带 来 | 
| 的 类 似 震 所 至 今 仍然 “默默 且 显著 地 ”改变 着 人 类 的 生活 ， 如 同 10 年 前 大 多 数 ， 
' 人 无 法 想象 手机 会 运行 几 百 个 不 同 应 用 一 样 换个 角度 思考 ， 如 果 能 够 利用 技术 ， 
' ' 视角 和 专业 精神 去 审视 那些 当代 重要 的 预测 法 则 ， 将 使 这 些 技术 人 才能 够 “借助 ， 
! 规律 预测 未 来 ”， 更 好 地 迎接 每 一 个 技术 震撼 带 来 的 时 代 变 革 ， 成 为 a ; 


自 1946 年 第 一 台数 字 电子 计算 机 诞生 以 来 ,计算 机 技术 先后 经 历 了 几 次 重大 技 
术 发 展 变 革 ， 具 有 鲜明 的 时 代 性 ， 与 之 相 适 应 ， 计 算 机 在 功能 性 和 可 编程 性 两 方面 
的 体现 也 不 相同 。 本 书 将 这 种 计算 机 技术 发 展 的 时 代 性 总 结 为 4 个 阶段 。 

第 一 阶段 : 1946 一 1981 年 ,“ 计 算 机 系统 结构 阶段 *。 这 个 阶段 始 于 1946 年 ， 
以 全 球 首 台 数字 计算 机 ENIAC 诞生 为 标志 。 在 这 个 阶段 ， 计 算 机 技术 主要 围绕 计 
算 机 系统 结构 设计 开展 ， 服 务 于 科学 计算 和 商业 数值 类 计算 ， 产 生 了 超级 计算 机 、 
高 性 能 计算 机 、 工 作 站 、 个 人 计算 机 等 不 同类 型 的 计算 机 系统 。 与 这 个 时 期 计算 机 
有 限 的 计算 性 能 和 功能 相对 应 ， 计 算 机 的 可 编程 性 主要 表现 为 合理 划分 软 /硬件 接 
口 、 探 制 计算 部 件 完 成 高 速 运算 ， 程 序 设 计 需 要 在 程序 逻辑 和 系统 结构 之 间 、 处 理 
能 力 和 存储 容量 之 间 、 计 算 和 通信 之 间 寻 找 优 化 和 折 中 。 这 个 阶段 的 计算 需求 催生 
了 执行 高 效 的 C 语言 (1972 年 )。C 语言 的 可 编程 性 体现 在 通过 指针 优化 底层 内 存 
的 使 用 ， 进 而 使 程序 在 有 限 计 算 资 源 下 高 速 运行 。 计 算 机 技术 的 第 一 个 阶段 持续 了 
35 年 ， 随 着 以 IBM PC 为 代表 的 个 人 计算 机 的 诞生 (1981 年 )， 计 算 机 技术 进入 了 
面向 大 众 的 新 阶段 。 

第 二 阶段 : 1982 一 2007 年 ,“ 计 算 机 网 络 和 视窗 阶段 ”"。 这 个 阶段 始 于 1982 年 ， 
以 面向 全 球 子 网 间 组 网 的 TCP/P 网 络 协议 的 标准 化 为 标志 ， 互 联网 (Internet， 最 
初 含义 是 连接 子 网 的 网 络 ) 时 代 到 来 了 。 在 这 个 阶段 ， 计 算 机 技术 主要 围绕 网 络 技 
术 、 视 窗 技 术 、 多 媒体 技术 发 展 ， 以 个 人 计算 机 和 服务 器 为 主要 计算 平台 ， 计 算 机 
技术 提供 满足 个 人 计算 需求 的 视窗 应 用 和 网 络 服务 。 由 于 网 络 将 不 同类 型 系统 互联 
互通 ,在 多 种 操作 系统 上 执行 同一 个 程序 的 跨 平台 特性 成 为 计算 机 编程 的 迫切 需求 ， 
由 此 诞生 了 具备 跨 平台 功能 的 Java 语言 (1995 年 )。 与 此 同时 ， 由 于 微软 Windows 
操作 系统 在 个 人 计算 机 领域 的 高 度 普及 ， 视 窗 应 用 “所 见 即 所 得 ”的 开发 需求 催生 
了 Visual C++ (VC)、Visual Basic (VB) (1991 年 ) 等 视窗 编程 语言 。 计 算 机 技术 
的 第 二 个 阶段 持续 了 25 年 ， 随 着 美国 苹果 公司 iPhone 智能 手机 的 推出 (2007 年 ) 
和 广泛 普及 ， 计 算 机 技术 进入 了 面向 移动 网 络 应 用 的 新 阶段 。 
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第 三 阶段 ，2008 年 至 今 ,“ 复 杂 信 息 系统 阶段 *。 这 个 阶段 始 于 2008 年 ， 以 安 
卓 (Andriod) 开源 移动 操作 系统 的 发 布 为 起 点 ， 一 批 新 的 计算 概念 和 技术 几乎 同时 
提出 并 显著 推动 了 计算 技术 的 升级 换代 ， 这 些 概念 包括 移动 互联 网 、 多 核 众 核 、 云 
计算 、 可 信 计 算 、 大 数据 、 可 穿戴 计算 、 物 联网 、 互 联网 + 等 。 这 些 概念 的 提出 反 
映 了 计算 平台 和 应 用 的 多 样 性 ， 也 带 来 了 更 复杂 的 安全 问题 。 虽 然 概念 很 多 ， 但 没 
有 以 哪个 概念 为 主 引 领 技术 发 展 ， 这 说 明 ， 计 算 机 技术 的 发 展 已 经 进入 了 复杂 信息 
系统 阶段 ， 这 个 阶段 很 难 有 任何 一 个 技术 领域 独 领 风 骚 ， 任 何 系统 都 需要 不 间断 地 
完善 才能 够 提供 更 加 安全 可 靠 及 更 佳 用 户 体验 的 功能 ， 系 统 之 间 通 过 网 络 、 开 源 项 
目 和 社交 关系 等 高 度 关联 ， 人 类 将 会 逐渐 认识 到 计算 机 系统 的 复杂 性 会 到 达 人 类 所 
能 掌控 的 边界 。 面 对 复杂 的 功能 性 和 紧迫 的 迭代 周期 ， 计 算 机 需要 更 高 抽象 级 别 的 
程序 设计 语言 来 表达 可 编程 性 ，Python 语言 (2008 年 3.0 版 本 ) 已 经 成 为 这 个 阶段 
计算 机 系统 的 主流 编程 语言 。 

第 四 阶段 : 约 20 年 后 某 个 时 期 开始 ,“ 人 工 智能 阶段 ”"。 随 着 深度 学 习 、 开 源 硬 
件 、 智 能 机 器 人 、 在 线 搜索 引擎 、 量 子 计 算 等 技术 的 发 展 ， 未 来 某 个 时 期 将 会 出 现 
人 工 智能 主导 计算 的 技术 阶段 ， 计 算 机 技术 将 结合 智能 技术 展示 更 加 友好 的 交互 方 
式 和 用 户 体 验 。 此 时 ， 计 算 机 或 许 已 经 没有 了 独立 的 载体 ， 它 将 通过 网 络 、 数 据 和 
机 器 整合 一 切 可 用 自然 资源 ， 逐 步 接管 人 类 所 有 非 创造 性 工作 ， 计 算 机 技术 将 进入 
一 个 未 知 的 新 阶段 。 

纵 观 计算 机 技术 短暂 的 发 展 历史 ， 计 算 机 功能 性 和 可 编程 性 的 发 展 存在 相互 促 
进 的 关系 。 一 方面 ， 计 算 机 的 编程 方式 逐步 让 计算 机 更 有 效 地 理解 人 类 意图 ， 进 而 
丰富 计算 机 的 功能 。 另 一 方面 ， 计 算 机 的 功能 发 展 进一步 促进 了 编程 方式 的 发 展 。 
应 该 说 ， 计 算 机 正在 借助 人 类 智慧 不 断 “ 进 化 ”。 


思考 与 练习 

1.1 计算 机 的 定义 是 什么 ? 它 有 哪 两 个 显著 特点 ? 

1.2 ”请 调研 并 阐述 不 少 于 3 个 计算 机 领域 中 类 似 摩尔 定律 的 预测 法 则 或 评估 
法 则 。 

1.3 请 列 出 并 阐述 不 少 于 5 个 近 10 年 出 现 的 计算 机 技术 名 词 。 


1.2 程序 设计 语言 


“要 大 天 程序 设计 语言 的 执行 方式 包括 编译 执行 和 解释 执行 两 种 : 


-= 


1.2.1 程序 设计 语言 概述 


旦 序 设计 语言 是 计算 机 能 够 理解 和 识别 用 户 操 作 意 图 的 一 种 交互 体系 ， 它 按照 
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特定 规则 组 织 计算 机 指令 ， 使 计算 机 能 够 自动 进行 各 种 运算 处 理 。 按 照 程 序 设 计 语 
言 规则 组 织 起 来 的 一 组 计算 机 指令 称 为 计算 机 程序 。 程 序 设计 语言 也 叫 编程 语言 ， 
本 书 两 种 说 法 都 会 出 现 并 交替 使 用 。 

程序 设计 语言 包括 3 个 大 类 : 机 器 语言 、 汇 编 语言 和 高 级 语言 。 

机 器 语言 是 一 种 二 进 制 语言 ， 它 直接 使 用 二 进 制 代码 表达 指令 ， 是 计算 机 硬件 
可 以 直接 识别 和 执行 的 程序 设计 语言 。 例 如 ， 执 行 数字 2 和 3 的 加 法 ，16 位 计算 机 
上 的 机 器 指令 为 ， 11010010 00111011， 不 同 计算 机 结构 的 机 器 指令 不 同 。 

直接 使 用 机 器 语言 编写 程序 十 分 繁 见 ， 同 时 ， 二 进 制 代码 编写 的 程序 难以 阅读 
和 修改 ,因此 , 汇编 语言 诞生 了 ， 它 使 用 助 记 符 与 机 器 语言 中 的 指令 进行 一 一 对 应 ， 
在 计算 机 发 展 早期 能 帮助 程序 员 提 高 编程 效率 。 例 如 ， 执 行 数字 2 和 3 的 加 法 ， 汇 
编 语言 指令 为 : add 2, 3, result， 运 算 结 果 写 入 result。 与 机 器 语言 类 似 ， 不同 计算 机 
结构 的 汇编 指令 不 同 。 由 于 机 器 语言 和 汇编 语言 都 直接 操作 计算 机 硬件 并 基于 此 设 
计 ， 所 以 它们 统称 为 低级 语言 。 

高 级 语言 与 低级 语言 的 区 别 在 于 ， 高 级 语言 是 接近 自然 语言 的 一 种 计算 机 程序 
设计 语言 ， 可 以 更 容易 地 描述 计算 问题 并 利用 计算 机 解决 计算 问题 。 例 如 ， 执 行 数 
字 2 和 3 加 法 ， 高 级 语言 代码 为 : result=2+3， 这 个 代码 只 与 编程 语言 有 关 ， 与 计 
算 机 结构 无 关 ， 同 一 种 编程 语言 在 不 同 计算 机 上 的 表达 方式 是 一 致 的 。 

如 果 能 像 科幻 电影 中 的 情节 一 样 ， 用 人 类 语言 驱动 计算 机 将 是 最 完美 的 事情 。 
遗憾 的 是 ， 尽 管 许 多 一 流 科学 家 为 此 做 过 很 多 努力 ， 仍 然 无 法 在 可 预见 的 未 来 设计 
出 能 完全 理解 人 类 语言 的 计算 机 。 

诚然 ， 即 使 计算 机 能 理解 人 类 语言 ， 人 类 语言 也 不 适合 描述 复杂 算法 ， 这 是 因 
为 人 类 语言 具有 不 严密 和 模糊 的 缺点 。 例 如 ,“ 我 看 见 一 个 人 在 公园 ， 带 着 望远镜 。” 
这 句 话 ， 基 于 常识 和 经 验 ， 交 谈 双 方 大 多 数 情况 下 能 够 理解 彼此 表达 的 意思 ， 但 深 
究 一 下 ， 究 竟 是 “我 ” 带 着 望远镜 ， 还 是 “一 个 人 ” 带 着 望远镜 呢 ? 这 种 模糊 性 也 
经 常 产生 错误 理解 和 歧义 。 相 比 人 类 语言 , 程序 设计 语言 的 结构 在 语法 上 十 分 精密 ， 
在 语义 上 定义 准确 。 

第 一 个 广泛 应 用 的 高 级 语言 是 诞生 于 1972 年 的 C 语言 。 随 后 40 多 年 来 先后 诞 
生 了 600 多 种 程序 设计 语言 ,但 是 大 多 数 语言 由 于 应 用 领域 的 狭窄 退出 了 历史 舞台 。 
下 面 列 出 的 是 至 今 还 经 常 使 用 的 程序 设计 语言 ， 包 括 C、C++、C#、Go、HTML、 
Java、JjJavaScript、PHP、Python、SQL、YVerilog 等 。 一 般 来 说 ， 通 用 编程 语言 比 专 
用 于 某 些 领域 的 编程 语言 生命 力 更 强 。 

丘 展 : 通用 编程 语言 
“ 通用 编程 语言 指 能 够 用 于 编写 多 种 用 途 程序 的 编程 语言 ( 相对 于 专用 编程 语 ， 
! 言 )， 例如 ，Python 语言 是 一 个 通用 编程 语言 ， 可 以 用 于 编写 各 种 类 型 的 应 用 ， 
| 该 语言 的 语法 中 没有 专门 用 于 特定 应 用 的 程序 元 素 . HTML 语言 则 是 一 个 专用 纺 
! 程 语言 ， 它 利用 超 链接 将 文本 、 图 像 、 音 /视频 等 资源 组 织 起 来 形成 Web 页 面 。 
' 尽管 有 些 编程 语言 不 包含 针对 特定 应 用 的 程序 元 素 ， 但 由 于 语言 所 应 用 的 领域 比 
' 较 狭 窄 ， 也 被 认为 是 专用 编程 语言 。 


Soe 


(Noe 
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人 常用 编程 语言 中 ，C、C++、C#、Go、Java、Python 是 通用 编程 语言 ，HTML ) 
'( Web 页 面 超 链接 语言 ) JavaScript( Web 浏览 器 端 动 态 脚本 语言 ) MATLAB( 基 ， 
于 短 阵 运算 的 科学 计算 语言 ) PHP ( Web 服务 器 端 动态 肝 示 语言 和 SQL (数据 
' 库 操作 语言 )、Verilog (硬件 描述 语言 ) 是 专用 编程 语言 


高 级 语言 按照 计算 机 执行 方式 的 不 同 可 分 成 两 类 : 静态 语言 和 脚本 语言 。 这 里 
所 说 的 执行 方式 是 指 计算 机 执行 一 个 程序 的 过 程 ， 静 态 语 言 采 用 编译 执行 ， 脚 本 语 
言 采 用 解释 执行 。 无 论 哪 种 执行 方式 ， 用 户 的 使 用 方法 可 以 是 一 致 的 ， 如 通过 鼠标 
双击 执行 一 个 程序 。 

编译 是 将 源 代码 转换 成 目标 代码 的 过 程 ， 通 常 ， 源 代码 是 高 级 语言 代码 ， 目 标 
代码 是 机 器 语言 代码 ， 执 行 编译 的 计算 机 程序 称 为 编译 器 (Compiler)。 如 图 1.1 展 
示 了 程序 的 编译 过 程 ， 其 中 ， 虚 线 表示 目标 代码 被 计算 机 运行 。 编 译 器 将 源 代码 转 
换 成 目标 代码 ， 计 算 机 可 以 立即 或 稍 后 运行 这 个 目标 代码 。 


高 级 语言 z 机 器 语言 


图 1.1 程序 的 编译 和 执行 过 程 


解释 是 将 源 代码 逐条 转换 成 目标 代码 同时 逐条 运行 目标 代码 的 过 程 。 执 行 解释 
的 计算 机 程序 称 为 解释 器 (Interpreter)。 如 图 1.2 展示 了 程序 的 解释 过 程 。 其中， 高 
级 语言 源 代码 与 数据 一 同 输入 给 解释 器 ， 然 后 输出 运行 结果 。 


高 级 语言 
源 代码 


图 1.2 程序 的 解释 和 执行 过 程 


解释 和 编译 的 区 别 在 于 编译 是 一 次 性 地 翻译 ， 一 旦 程序 被 编译 ， 不 再 需要 编译 
程序 或 者 源 代码 。 解 释 则 在 每 次 程序 运行 时 都 需要 解释 器 和 源 代码 。 这 两 者 的 区 别 
类 似 于 外 语 资料 的 翻译 和 实时 的 同 声 传译 。 

编译 过 程 只 进行 一 次 ， 所 以 ， 编 译 过 程 的 速度 并 不 是 关键 ， 目 标 代码 的 运行 速 
度 是 关键 。 因 此 ， 编 译 器 一 般 都 集成 尽 可 能 多 的 优化 技术 ， 使 生成 的 目标 代码 具备 
更 好 的 执行 效率 。 然 而 ， 解 释 器 却 不 能 集成 太 多 优化 技术 ， 因 为 代码 优化 技术 会 消 
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耗 运行 时 间 ， 使 整个 程序 的 执行 速度 受到 影响 。 

采用 编译 方式 有 如 下 好 处 。 

(1) 对 于 相同 源 代 码 ， 编 译 所 产生 的 目标 代码 执行 速度 更 快 。 

(2) 目标 代码 不 需要 编译 器 就 可 以 运行 ， 在 同类 型 操作 系统 上 使 用 灵活 。 

采用 解释 方式 有 如 下 好 处 。 

(1) 解释 执行 需要 保留 源 代码 ， 程 序 纠 错 和 维护 十 分 方便 。 

(2) 只 要 存在 解释 器 ， 源 代码 可 以 在 任何 操作 系统 上 运行 ， 可 移植 性 好 。 

简单 地 说 ， 解 释 执行 、 逐 条 运行 用 户 编写 的 代码 ， 没 有 纵览 全 部 代码 的 性 能 优 
化 过 程 ， 因 此 执行 性 能 略 低 ， 但 可 以 支持 跨 硬 件 或 操作 系统 平台 ， 保 留 源 代 码 对 升 
级 维护 十 分 有 利 ， 适 合 非 性 能 关键 的 程序 运行 场景 。 

采用 编译 执行 的 编程 语言 是 静态 语言 ， 如 C 语言 、Java 语言 ， 采 用 解释 执行 的 
编程 语言 是 脚本 语言 ， 如 JavaScript 语言 、PHP 语言 。Python 语言 是 一 种 被 广泛 使 
用 的 高 级 通用 脚本 编程 语言 ， 虽 采用 解释 执行 方式 ， 但 它 的 解释 器 也 保留 了 编译 器 
的 部 分 功能 ， 随 着 程序 运行 ， 解 释 器 也 会 生成 一 个 完整 的 目标 代码 。 这 种 将 解释 器 
和 编译 器 结合 的 新 解释 器 是 现代 脚本 语言 为 了 提升 计算 性 能 的 一 种 有 益 演 进 。 


1.2.3 计算 机 编程 


一 一 为 什么 要 学 习 计算 机 编程 ? 

一 一 因为 “编程 是 件 很 有 趣 的 事 儿 ?”! 

编程 能 够 训练 思维 。 编 程 体现 了 一 种 抽象 交互 关系 、 形 式 化 方法 执行 的 思维 模 
式 , 称 为 “计算 思维 ”。 计算 思维 是 区 别 于 以 数学 为 代表 的 逻辑 思维 和 以 物理 为 代表 
的 实证 思维 的 第 三 种 思维 模式 。 编 程 是 一 个 求解 问题 的 过 程 ， 首 先 需 要 分 析 问 题 ， 
抽象 内 容 之 间 的 交互 关系 ,设计 利用 计算 机 求解 问题 的 确定 性 方法 ， 进 而 通过 编写 
和 调试 代码 解决 问题 ， 这 是 从 抽象 问题 到 解决 问题 的 完整 过 程 。 计 算 思 维 的 训练 过 
程 能 够 促进 入 类 思考 ， 增 进 观 察 力 和 深化 对 交互 关系 的 理解 。 

编程 能 够 增进 认识 。 编 写 程序 不 单纯 是 求解 计算 题 ， 它 要 求 作者 不 仅 要 思考 解 
决 问题 的 方法 ， 更 要 思考 如 何 让 程序 有 更 好 的 用 户 体验 、 更 高 的 执行 效率 和 更 有 趣 
的 展示 效果 。 不 同 群体 、 不 同时 代 、 不 同文 化 对 程序 使 用 有 着 不 同 理解 ， 编 程 需要 
对 时 代 大 环境 和 使 用 群体 小 环境 有 更 多 认识 ， 从 细微 处 给 出 更 好 的 程序 体验 ， 这 些 
思考 和 实践 将 帮助 程序 作者 加 深 对 用 户 行为 以 及 社会 和 文化 的 认识 。 

编程 能 够 带 来 乐趣 。 利 用 一 台 计 算 机 ， 编 程 能 够 提供 展示 自身 思想 和 能 力 的 舞 
台 ， 将 所 思 所 想 变 为 现实 。 编 程 的 开始 有 各 种 动机 ， 或 者 去 展示 自己 的 青春 风采 ， 
或 者 讽刺 不 文明 的 社会 现象 ， 或 者 向 爱慕 的 对 象 表达 情怀 ， 所 有 这 些 想 法 都 可 以 通 
过 编写 程序 变 成 现实 ， 并 通过 互联 网 零 成 本 分 发 获得 更 大 的 影响 力 。 这 些 努 力 会 让 
世界 增加 新 的 颜色 、 让 自己 变 得 更 酷 、 提 升 心理 满足 感 和 安全 感 。 

编程 能 够 提高 效率 。 计 算 机 已 经 成 为 当今 社会 的 普通 工具 ， 人 掌握 一 定编 程 技术 
有 助 于 更 好 地 利用 计算 机 解决 所 面 对 的 计算 问题 。 例 如 ， 对 于 个 人 照片 ， 可 以 通过 
程序 读 取 照 片 元 属性 自动 进行 归 类 整理 。 对 于 工作 数据 ， 可 以 通过 程序 按照 特定 算 
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法 进行 批 处 理 并 绘制 统计 图 表 。 对 于 朋友 圈 的 好 文 ， 可 以 通过 程序 实时 关注 随时 点 
特 。 堂 握 一 些 编程 技术 能 够 提高 工作 、 生 活 和 学 习 效 率 。 

编程 带 来 就 业 机 会 。 程 序 员 是 信息 时 代 最 重要 的 工作 岗位 之 一 ， 国 内 外 对 程序 
员 的 缺口 都 在 百 万 级 及 以 上 规模 ， 就 业 前 景 广阔 。 程 序 员 职 业 往 往 并 不 需要 掌握 多 
种 编程 语言 ， 精 通 一 种 就 能 够 获得 就 业 机 会 。 如 果 读 者 不 喜欢 自己 的 专业 或 现在 的 
工作 ， 那 就 认真 学 习 程 序 设计 ， 换 个 更 有 趣 的 工作 吧 ! 

很 多 读者 都 有 一 个 误区 ,认为 编程 很 难 学 。 事 实 上 ,“ 编 程 不 是 一 件 很 难 的 事 儿 ”， 
因为 编写 程序 有 一 定 的 框架 和 模式 ， 只 要 理解 了 这 些 模式 ， 稍 加 练习 就 会 有 很 好 的 
学 习 效 果 。 学 习 一 门 编程 语言 ， 首 先 要 掌握 该 语言 的 语法 ( 既 要 系统 掌握 基本 语法 ， 
又 要 能 灵活 运用 )。 其 次 要 学 会 结合 计算 问题 设计 程序 结构 ， 从 程序 块 、 功 能 块 角度 
理解 并 设计 整个 程序 框架 。 最 后 要 掌握 解决 问题 的 能 力 ， 即 从 理解 计算 问题 开始 ， 
设计 问题 的 解决 方法 ， 并 通过 编程 语言 来 实现 。 学 习 计 算 机 编程 的 重点 在 于 练习 。 
不 仅 要 多 看 代码 ， 照 着 编号， 调试 运行 ， 还 要 在 参考 代码 思路 基础 上 独立 编写 ， 学 
会 举一反三 。 为 了 帮助 读者 掌握 程序 设计 能 力 ， 本 书 将 大 量 编程 概念 和 语法 通过 有 
趣 的 实例 组 织 起 来 ,并 展示 Python 语言 的 魅力 和 力量 。 希望 这 样 的 设计 能 够 为 读者 
的 Python 学 习 过 程 带 来 快乐 和 价值 。 


思考 与 练习 
1.4 ”CPU 可 以 直接 理解 什么 类 型 的 程序 设计 语言 ? 
1.5 请 阐述 编译 和 解释 两 种 执行 方式 的 区 别 和 各 自 的 优 缺 点 。 
1.6 结合 读者 的 实际 情况 ， 请 列 出 不 少 于 3 个 学 习 编 程 语 言 的 理由 。 


1.3 ”Python 语言 概述 


1.3.1 Python 语言 的 发 展 


Python 语言 诞生 于 1990 年 ， 由 Guido van Rossum 设计 并 领导 开发 。1989 年 12 
月 ，Guido 考虑 启动 一 个 开发 项 目 以 打发 圣诞 节 前 后 的 时 间 ， 所 以 决定 为 当时 正在 
构思 的 一 个 新 的 脚本 语言 写 一 个 解释 器 ， 因此 在 次 年 诞生 了 Python 语言 。 该 语言 以 
“Python” 命 名 源 于 Guido 对 当时 一 部 英 剧 “Monty Python’s Flying Circus” 的 极 大 兴 
趣 。 也 许 Python 语言 的 诞生 是 个 偶然 事件 ， 但 20 多 年 持续 不 断 的 发 展 将 这 个 偶然 
事件 变 成 了 计算 机 技术 发 展 过 程 中 的 一 件 大 事 。 

Python 语言 是 开源 项 目的 优秀 代表 ， 其 解释 器 的 全 部 代码 都 是 开源 的 ， 可 以 在 
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Python 语言 的 主 网 站 (https://www.python.org/) 自 由 下 载 。Python 软件 基金 会 (Python 
Software Foundation，PSF〉 作 为 一 个 非 营 利 组 织 ， 拥 有 Python 2.1 版 本 之 后 所 有 版 
本 的 版 权 ， 该 组 织 致 力 于 更 好 推进 并 保护 Python 语言 的 开放 性 。 

2000 年 10 月 ，Python 2.0 正式 发 布 ， 标 志 着 Python 语言 完成 了 自身 涅 加 ， 解 
决 了 其 解释 器 和 运行 环境 中 的 诸多 问题 ， 开 启 了 Python 广泛 应 用 的 新 时 代 。2010 
年 ，Python 2.x 系列 发 布 了 最 后 一 版 ， 其 主 版 本 号 为 2.7， 用 于 终结 2.x 系列 版 本 的 
发 展 ， 并 且 不 再 进行 重大 改进 。 

2008 年 12 月 ，Python 3.0 正式 发 布 ， 这 个 版 本 在 语法 层面 和 解释 器 内 部 做 了 很 
多 重大 改进 ， 解 释 器 内 部 采用 完全 面向 对 象 的 方式 实现 。 这 些 重要 修改 所 付出 的 
代价 是 3.x 系列 版 本 代码 无 法 向 下 兼容 Python 2.0 系列 的 既 有 语法 ， 因 此 ， 所 有 
基于 Python 2.0 系列 版 本 编写 的 库 函 数 都 必须 修改 后 才能 被 Python 3.0 系列 解释 器 
运行 。 

Python 语言 经 历 了 一 个 痛苦 但 令 人 期 待 的 版 本 更 迭 过 程 ， 从 2008 年 开始 ， 用 
Python 编写 的 几 万 个 函数 库 开 始 了 版 本 升级 过 程 , 至 今 , 绝 大 部 分 Python 函数 库 和 
Python 程序 员 都 采用 Python 3.0 系列 语法 和 解释 器 。 本 书 1.6 节 将 具体 阐述 Python 
2.x 和 Python 3.x 的 不 同 。 

“Python 2.x 已 经 是 遗产 ，Python 3.x 是 这 个 语言 的 现在 和 未 来 ”。 

括 展 ， 开源 软件 

开源 软件 ( Open-Source Software ) 是 一 类 开放 源 代码 软件 的 统称 ， 这 类 软件 ， 
' 的 源 代码 在 特定 许可 协议 范围 内 ， 可 以 被 任何 人 学 习 、 修 改 甚至 发 布 ， 开源 软件 ， 
更 多 定义 和 资源 请 参考 开源 软件 社区 网 站 (https://opensource.org )。 开 源 软 件 从 ! | 
，1998 年 开始 被 众多 资深 程序 员 定 义 并 推动 ， 至今 ， 世 界 上 有 几 十 万 个 开源 软件 项 ， 
! 目 ， 履 盖 几 乎 所 有 软件 应 用 领域 。 开 源 软件 为 计算 机 技术 快速 发 展 扫 清 了 知识 产 | 
' 权 障 碍 ， 降 低 了 学 习 成 本 ， 互 联网 也 进一步 推动 了 开源 软件 的 传播 。 如 今 ， 全 球 ， 
' 80% 以 上 的 服务 器 运行 开源 软件 ， 每 年 为 用 户 节省 600 亿美 元 以 上 的 使 用 成 本 . ' 
' 开源 软件 成 就 了 当代 计算 机 技术 的 发 展 程度 ， 在 深层 次 上 影响 着 未 来 信息 技术 的 ， 
' 发 展 速度 和 普及 程度 。 | 


~ ee Ee Ee SEE so Se- 


1.3.2 ”编写 Hello 程序 


学 习 编 程 语言 有 一 个 惯例 ， 即 运行 最 简单 的 Hello 程序 ， 该 程序 功能 是 在 屏幕 
上 打印 输出 “Hello World”。 这 个 程序 虽 小 ， 但 却 是 初学 者 接触 编程 语言 的 第 一 步 。 
使 用 Python 语言 编写 的 Hello 程序 只 有 一 行 代码 ， 如 下 : 

Print("Hello World") 

上 述 代 码 中 , print0 表 示 将 括号 中 引号 内 的 信息 输出 到 屏幕 上 。 该 代码 在 Python 
运行 环境 (1.4 节 将 具体 介绍 Python 运行 环境 的 配置 ) 中 的 执行 效果 如 下 : 
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>>>Print("Hel1lo World") 
Hello World 

其 中 ， 第 一 行 的 “>>>” 是 Python 语言 运行 环境 的 提示 符 ， 其 表示 可 以 在 此 符 
号 后 面 输入 Python 语句 。 第 二 行 是 Python 语句 的 执行 结果 。 

Python 语言 的 Hello 程序 似乎 与 人 类 语言 类 似 ， 即 通过 一 行 语句 就 完成 了 输出 
一 段 文 本 的 任务 。 其 他 编程 语言 的 Hello 程序 并 不 这 样 简洁 , 如 下 是 C 语言 的 Hello 
程序 ， 对 比 一 下 。 

#include <stdio.h> 

int main (void) 

{ 

printf ("Hello World\n"); 
return 0; 

} 

C 语言 程序 除了 向 屏幕 输出 “Hello World” 的 printf 语句 外 ， 还 包含 了 include、 
int、main、printf、return 等 其 他 辅助 元 素 ， 这 里 就 不 具体 介绍 了 。 这 个 最 小 的 例子 
只 是 一 个 缩影 , Python 的 简洁 性 在 编程 语言 领域 是 公认 的 。 同样 功 能 的 程序 , Python 
语言 实现 的 代码 行 数 仅 相当 于 C 语言 的 10 一 1/5( 其 简洁 程度 取决 于 程序 的 复杂 度 
和 规模 )。 更 少 的 代码 行 数 、 更 简洁 的 表达 方式 将 带 来 更 少 的 程序 错误 、 更 快 的 程序 
开发 速度 和 更 好 的 可 读 性 。 


1.3.3 Python 语言 的 特点 


Python 语言 是 一 种 被 广泛 使 用 的 高 级 通用 脚本 编程 语言 ， 具 有 很 多 区 别 于 其 他 
语言 的 特点 ， 这 里 仅 列 出 如 下 一 些 重要 特点 。 

(1) 语法 简洁 : 实现 相同 功能 ，Python 语言 的 代码 行 数 仅 相当 于 其 他 语言 的 
1/10 一 1/S。 

(2) 与 平台 无 关 : 作为 脚本 语言 ，Python 程序 可 以 在 任何 安装 解释 器 的 计算 机 
环境 中 执行 ， 因 此 ， 用 该 语言 编写 的 程序 可 以 不 经 修改 地 实现 跨 平台 运行 。 

(3) 粘性 扩展 : Python 语言 具有 优异 的 扩展 性 ， 体 现在 它 可 以 集成 C、C++、 
Java 等 语言 编写 的 代码 ， 通 过 接口 和 函数 库 等 方式 将 它们 “ 粘 起 来 ”( 整 合 在 一 
起 )。 此 外 ，Python 语言 本 身 提供 了 良好 的 语法 和 执行 扩展 接口 ， 能 够 整合 各 类 程 
序 代码 。 

(4) 开源 理念 : 对 于 高 级 程序 员 ，Python 语言 开源 的 解释 器 和 函数 库 具 有 强大 
的 吸引 力 ， 更 重要 地 ，Python 语言 倡导 的 开源 软件 理念 为 该 语言 发 展 奠定 了 坚实 的 
群众 基础 。 

(5) 通用 灵活 : Python 语言 是 一 个 通用 编程 语言 ， 可 用 于 编写 各 领域 的 应 用 程 
序 ， 这 为 该 语法 提供 了 广阔 的 应 用 空间 。 几 乎 各 类 应 用 ， 从 科学 计算 、 数 据 处 理 到 
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人 工 智 能 、 机 器 人 ，Python 语言 都 能 够 发 挥 重 要 作用 。 

(6) 强制 可 读 : Python 语言 通过 强制 缩 进 《类 似 文章 段落 的 首 行 空 格 ) 来 体 
现 语 名 间 的 罗 辑 关系 ， 显 著 提 高 了 程序 的 可 读 性 ， 进 而 增加 了 Python 程序 的 可 维 
护 性 。 

(7) 支持 中 文 ， Python 3.0 解释 器 采用 UTF-8 编码 表达 所 有 字符 信息 。UTF-8 
编码 可 以 表达 英文 、 中 文 、 韩 文 、 法 文 等 各 类 语言 ， 因 此 ，Python 程序 在 处 理 中 文 
时 更 加 灵活 且 高 效 。 

(8) 模式 多 样 : 尽管 Python 3.0 解释 器 内 部 采用 面向 对 象 方式 实现 ， 但 Python 
语法 层面 却 同时 支持 面向 过 程 和 面向 对 象 两 种 编程 方式 ， 这 为 使 用 者 提供 了 灵活 的 
编程 模式 。 

(9) 类 库 丰 富 : Python 解释 器 提供 了 几 百 个 内 置 类 和 函数 库 ， 此 外 ， 世 界 各 地 
程序 员 通 过 开源 社区 贡献 了 十 几 万 个 第 三 方 函数 库 ， 几 乎 覆盖 了 计算 机 技术 的 各 个 
领域 ， 编 写 Python 程序 可 以 大 量 利用 已 有 的 内 置 或 第 三 方 代码 ， 具 备 良好 的 编程 

本 书后 续 章节 将 会 逐步 揭 开 Python 语言 的 神秘 面纱 ， 带 领 读者 利用 Python 语 
言 解决 一 个 个 有 趣 又 实用 的 计算 问题 。 后 续 行文 除 个 别 地 方 外 ， 将 用 “Python” 代 
替 “Python 语言 >， 并 根据 行文 内 容 交替 使 用 “编程 ”和 “程序 设计 ”。 


思考 与 练习 
1.7 请 列 出 不 少 于 3 个 开源 软件 的 意义 。 
1.8 ”请 列 出 不 少 于 5 个 Python 语言 的 特点 。 
1.9 在 屏幕 上 输出 “祖国 ， 你 好 ”的 Python 语句 。 


1.4 Python 语言 开发 环境 配置 


Sd 


1.4.1 安装 Python 解释 器 


Python 语言 解释 器 是 一 个 轻 量 级 的 小 尺寸 软件 , 可 以 在 Python 语言 主 网 站 上 下 
载 〈 文 件 大 小 约 为 25 一 30 MB )， 网 址 如 下 : 

https://www.python.org/downloads/ 

也 可 以 在 与 本 书 关联 的 中 文 网 站 上 下 载 ， 网 址 如 下 : 

http://www.python123.0rg/downloads/ 
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其 中 ，Python 解释 器 主 网 站 下 载 页 面 如 图 1.3 所 示 。 


BB python 


图 1.3 Python 解释 器 主 网 站 下 载 页 面 


如 上 图 ， 首 先 根据 所 用 操作 系统 版 本 选择 相应 的 Python 3.x 系列 安装 程序 。 如 
图 1.3， 单 击 图 中 矩形 内 的 按钮 下 载 Python 3.5.2 版 本 程序 。 这 个 位 置 放置 的 是 
Python 最 新 的 稳定 版 本 ， 随 着 Python 语言 发 展 ， 此 处 会 有 更 新 的 版 本 ， 本 书 内 容 统 
一 以 3.5.2 版 本 为 代表 。 以 Windows 操作 系统 为 例 , 单 击 图 中 按钮 下 载 python-3.5.2.exe 
文件 。 其 他 操作 系统 请 选择 @ 内 相应 链接 ， 并 找到 对 应 文件 进行 下 载 。 

Python 最 新 的 3.x 系列 解释 器 会 逐步 发 展 ， 对 于 初学 Python 的 读者 ， 建 议 采 用 
3.5.2 或 之 后 的 版 本 ， 可 以 不 使 用 最 新 版 本 。 如 果 所 在 系统 无 法 安装 3.5.2 版 本 ， 则 
请 使 用 3.4.2 版 本 。 

双击 所 下 载 的 程序 安装 Python 解释 器 ， 然 后 将 启动 一 个 如 图 1.4 所 示 的 引导 过 
程 。 在 该 页 面 中 ， 勾 选 图 中 矩形 框 内 的 Add Path 3.5 to PATH 复 选 框 。 


(32-bit) Setup a * | 


Install Python 3.5.2 (32-bit) 


Select Install Now to install Python with default settings, or choose 
Customize to enable or disable features, 


四 install Now 
CAUsers\DELL-PCAppData\LocaN\Programs\Python\Python35-32 


Includes iDLE, pip and documentation 
Creates shortcuts and fle assorciations 


-> Customize installation 
Choose location snd features 


python 
for Install launcher for all users (recommended) 


Windows [GndPyhon35toPA| 


图 1.4 安装 程序 引导 过 程 的 启动 页 面 
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安装 成 功 后 将 显示 如 图 1.5 所 示 的 成 功 页 面 。 
python 3.52 (32-bit) Setup 


Setup was successful 


Special thanks to Mark Hammond, without whose years of freely 
shared Windows expertise, Python for Windows would still be Python 
for DOS. 


New to Python? Start with the online tutorial and documentation. 


图 1.5 安装 程序 引导 过 程 的 成 功 页面 


Python 安装 包 将 在 系统 中 安装 一 批 与 Python 开发 和 运行 相关 的 程序 , 其 中 最 重 
要 的 两 个 是 Python 命令 行 和 Python 集成 开发 环境 (Python's Integrated DeveLopment 
Environment，IDLE )。 


1.4.2 运行 Hello 程序 


运行 Python 程序 有 两 种 方式 : 交互 式 和 文件 式 。 交 互 式 指 Python 解释 器 即时 
响应 用 户 输 入 的 每 条 代码 , 给 出 输出 结果 。 文件 式 , 也 称 为 批量 式 , 指 用 户 将 Python 
程序 写 在 一 个 或 多 个 文件 中 , 然后 启动 Python 解释 器 批量 执行 文件 中 的 代码 。 交互 
式 一 般 用 于 调试 少量 代码 ， 文 件 式 则 是 最 常用 的 编程 方式 。 其 他 编程 语言 通常 内 
文件 式 执行 方式 。 下 面 以 Windows 操作 系统 中 运行 Hello 程序 为 例 具体 说 明 两 种 方 
式 的 启动 和 执行 方法 。 

1. 交互 式 启动 和 运行 方法 

交互 式 有 两 种 启动 和 运行 方法 。 

第 一 种 方法 ， 启 动 Windows 操作 系统 命令 行 工具 (<Windows 系统 安装 目录 六 
system32\cmd.exe)， 在 控制 台中 输入 “Python”， 在 命令 提示 符 >>> 后 输入 如 下 程序 
代码 : 

Print("Hello World") 

按 Enter 键 后 显示 输出 结果 “Hello world”， 如 图 1.6 所 示 。 

在 >>> 提 示 符 后 输入 exit() 或 者 quit0 可 以 退出 Python 运行 环境 。 

第 二 种 方法 ， 通 过 调用 安装 的 IDLE 来 启动 Python 运行 环境 。IDLE 是 Python 
软件 包 自 带 的 集成 开发 环境 ， 可 以 在 Windows“ 开 始 ” 菜 单 中 搜索 关键 词 “IDLE” 
找到 IDLE 的 快捷 方式 。 如 图 1.7 展示 了 IDLE 环境 中 运行 Hello World 程序 的 效果 。 
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| 可 Command Prompt - python 


EE python 3.5.2 Shell 一 口 X 
| Fle Edit Shell Debug Options Window Help 


Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22: el 
01:18) [MSC v.1900 32 bit (Intel)] on win32 

Type "copyright", “credits" or "license()}" for more 
information. 


Ln:5 Cok4 


2. 文件 式 启动 和 运行 方法 
文件 式 也 有 两 种 运行 方法 ， 与 交互 式 相对 应 。 
第 一 种 方法 ， 按 照 Python 的 语法 格式 编写 代码 ， 并 保存 为 .py 形式 的 文件 (以 
Hello World 程序 为 例 ， 将 代码 保存 成 文件 hello.py)。Python 代码 可 以 在 任意 编辑 器 
中 编写 , 对 于 百 行 以 内 规模 的 代码 建议 使 用 Python 安装 包 中 的 IDLE 编辑 器 或 者 第 
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三 方 开源 记事 本 增强 工具 Notepad++。 然 后 ， 打 开 Windows 的 命令 行 (cmd.exe)， 
进入 hello.py 文件 所 在 目录 ， 运 行 Python 程序 文件 获 和 


导 输 出 ， 如 图 1.8 所 示 。 


Command Prompt 加 口 x 


第 二 种 方法 ， 打 开 IDLE， 按 快捷 键 CtrI+N 打开 一 个 新 窗口 ， 或 在 菜单 中 选择 
File 一 New File 选项 。 这 个 新 窗口 不 是 交互 模式 ， 它 是 一 个 具备 Python 语法 高 亮 辅 
助 的 编辑 器 ， 可 以 进行 代码 编辑 。 在 其 中 输入 Python 代码 , 例如, 输入 Hello World 
悍 序 并 保存 为 hello.py 文件 ,如 图 1.9 所 示 。 按 快捷 键 F5, 或 在 菜单 中 选择 Run 一 Run 
Module 选项 运行 该 文件 。 


[8@ helio.py 
File Edt Format Run QOptions Window Help 


print( ) .  ”  “ 国 


| 


一 
ln:1 Cotk2D 
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3. 启动 和 运行 方法 推荐 

交互 式 和 文件 式 共 有 4 种 Python 程序 运行 方法 , 其中, 最 常用 且 最 重要 的 是 采 
用 IDLE 的 文件 式 方法 。 

IDLE 是 一 个 简单 有 效 的 集成 开发 环境 ， 无 论 交 互 式 或 文件 式 ， 它 都 有 助 于 快 
速 编写 和 调试 代码 , 它 是 小 规模 Python 软件 项 目的 主要 编写 工具 。 本 书 所 有 程序 都 
可 以 通过 IDLE 编写 并 运行 。 行 文 方面 ， 对 于 单行 代码 或 通过 观察 输出 结果 讲解 少 
量 代码 的 情况 ， 本 书 采 用 IDLE 交互 式 (由 >>> 开 头 ) 进行 描述 ; 对 于 讲解 整 段 代码 
的 情况 ， 采 用 IDLE 文件 式 。 

对 于 完成 调试 确保 运行 无 误 的 程序 ， 总 是 希望 能 够 通过 单 击 鼠 标 直 接 运 行 ( 通 
过 命令 行 或 者 IDLE 启动 都 不 够 酷 !)， 这 个 过 程 叫做 “程序 发 布 ” 本 书 将 在 8.4 节 
介绍 利用 pyinstaller 库 在 Windows 平台 上 发 布 程序 的 方法 ， 让 程序 运行 也 酷 起 来 ! 
此 外 ， 附录 13.5 节 介 绍 一 个 比 IDLE 更 酷 、 更 强大 、 更 复杂 的 Python 语言 集成 开发 
环境 一 PyCharm， 它 主要 用 于 中 规模 及 以 上 的 软件 开发 项 目 ， 仅 为 有 兴趣 成 为 
Python 编程 大 牛 的 读者 提供 指引 。 


1.4.3 ”运行 Python 小 程序 


Hello World 程序 只 有 一 行 代码 ,实在 太 小 。 本 节 给 出 5 个 5 行 代码 左右 的 Python 
小 程序 ( 称 为 “ 微 实例 ”)， 供 读者 在 IDLE 交互 式 和 批量 式 两 种 方式 下 练习 。 这 5 
个 微 实例 分 别 给 出 了 交互 式 执行 过 程 和 文件 式 内 容 〈 即 全 部 程序 内 容 )。 

请 读者 暂时 忽略 这 些 实例 中 程序 的 具体 语法 含义 ,这 正 是 接 下 来 要 学 习 的 内 容 ， 
当然 ， 尝 试 理解 语法 也 十 分 有 益 。 请 在 IDLE 交互 环境 或 编辑 器 中 编写 并 运行 这 些 
程序 ， 确 保 它 们 可 以 输出 正确 结果 。 注意: 在 编辑 器 中 输入 代码 时 ，# 及 后 面 的 文字 
是 注释 ， 仅 用 来 帮助 读者 理解 程序 ， 不 影响 程序 执行 ， 可 以 不 用 输入 。 

【 微 实例 1.1】 圆 面积 的 计算 。 

根据 圆 的 半径 计算 圆 的 面积 。 交 互 式 执行 过 程 如 下 。 


>>>radius = 25 


>>>area = 3.1415 * radius * radius # 输入 计算 加 

>>>print (area) Co E> 2 ; | 
1963.4375000000002 

>>>print("{:.2f}".format(area))  。 # 只 输出 两 位 小 数 

1963.44 ， ， S 


微 实例 1.1 的 文件 式 内 容 如 下 ， 其 中 ， 首 行 微 实例 文件 名 对 应 本 书 的 电子 资源 
文件 名 "7 ， 读 者 可 以 将 代码 保存 为 任意 名 称 ， 左 侧 序号 为 代码 行 号 ， 以 辅助 阅读 ， 
不 是 程序 代码 的 组 成 部 分 。 


[1] 本 书 使 用 了 微 实例 、 实 例 、 程 序 练习 题 等 儿 种 教学 类 型 ， 为 了 便于 读者 区 分 它们 对 应 的 
源 代码 ， 文 件 、 微 实例 的 文件 名 以 m 开头 ， 程序 练习 题 答案 文件 名 以 a 开头 ， 正 文 讲解 实例 的 文 
件 名 以 e 开头， 之 后 包含 的 是 编号 和 功能 相关 的 描述 。 
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微 实 例 1.1 ml.1CalCircleArea. 
源 代码 工 -2: 
1 | radius = 25 # 圆 的 半径 是 25 加 面积 的 计算 
2 | area = 3.1415 * radius * radius # 输入 计算 圆 面 积 的 公式 
3 print (area) 
4 


print("{:.2f}".format (area)) # 只 输出 两 位 小 数 


【 微 实例 1.2】 简单 的 人 名 对 话 。 
A I Rs 


微 实例 1.2 的 文件 式 内 容 如 下 : 
微 实例 1.2 


| 1-3; 


ml.2EchoName:. 


name = input(" 输 入 姓名 :") 

print("{} 同 学 ， 学 好 Python， 前 途 无 量 ! " .format (name) ) 
print("{} 大 侠 ， 学 好 Python， 大 展 拳脚 ! " .format (name[0])) 
print("{} 哥 哥 ， 学 好 Python， 人 见 人 爱 ! " .format (name[1:])) 


WD 


【 微 实 例 1.3】 斐 波 那 契 数列 的 计算 。 
根据 斐 波 那 契 数列 的 定义 ， 输 出 不 大 于 1 000 的 序列 元 素 。 交 互 式 执行 过 程 


上 述 代码 中 ， 连 续 的 3 个 大 于 号 (>>>) 给 出 首 行 输入 提示 ，3 个 连续 点 (…) 
给 出 二 级 输入 提示 ， 表 示 延 续 上 一 行内 容 。 这 3 个 连续 点 在 IDLE 环境 中 可 能 出 现 
( 较 早 的 版 本 ) 或 不 出 现 〈 最 新 版 本 )， 如 果 不 出 现 则 会 出 现 连续 空格 。 
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拓展 : 奖 波 那 姜 数列 

-2 奖 波 那 契 数 列 ( i Sequence )， 又 称 为 黄金 分 割 数列 ， 由 意大利 数学 
家 Leonardo Fibonacci 于 1202 年 提出 ， 并 以 其 名 字 命 名 。 该 数列 F(n) 定 义 如 下 : 

' F(0)=0，F(1)=1，F(n)=F(n-2)+F(n-1)， 其 中 >2。 简 单 说 ， 裴 波 那 契 数 列 中 每 个 

' 数 是 前 两 个 数 之 和 。 斐 波 那 契 数列 中 邻近 两 个 数 的 比值 接近 黄金 分 审 数 ， 即 ， 


» 
、 
'] 
' 
} 
1 
J 
} 
, 


, 有 很 多 特性 ， 所 以 其 在 搜索 算法 、 组 合 数 学 、 现 代 物理 、 化 学 等 领域 均 有 应 用 。 ， 
| Python 语言 在 表达 和 计算 传统 数学 概念 上 十 分 简洁 ,读者 可 以 寻找 其 他 有 趣 的 数 ， 
' 学 概念 ， 并 用 Python 语言 计算 它们 。 : 


~ E 


微 实 例 1.3 的 文件 式 内 容 如 下 : 


_ 微 实例 1.3 ml.3CalFibonaccei.py 
i labs=s0,1 
2 | while a < 1000: # 输出 不 大 于 1000 的 序列 
3 Print(a, end=',') 
4 a,;, b=b,a+b 


【 微 实例 1.4】 同 切 圆 的 绘制 。 
绘制 4 个 不 同 半径 的 同 切 圆 。 交 互 式 执行 过 程 如 下 : 


>>>import turtle # 引用 turtle 库 
>>>turtle.pensize{(2) # 设置 画笔 宽度 为 2 像素 
>>>turtle.circle(10) # 绘制 半径 为 10 像素 的 圆 
>>>turtle.circle(40) # 绘制 半径 为 40 像素 的 圆 
>>>turtle.circle(80) # 绘制 半径 为 80 像素 的 圆 
>>>turtle.circle(160) # 绘制 半径 为 160 像素 的 圆 


随 着 每 条 语句 被 执行 ， 都 会 启动 一 个 窗 体 显 示 如 图 1.10 中 的 一 组 同 切 圆 。 
微 实例 1.4 的 文件 式 内 容 如 下 : 


_ 微 实例 1.4 ml.4DrawTangentCircles.py 
1 | import turtle # 引用 turtle 库 
2 | turtle.pensize (2) # 设置 画笔 宽度 为 2 像素 
x: turtle.circle (10) # 绘制 半径 为 10 像素 的 圆 
a turtle.circle (40) # 绘制 半径 为 40 像素 的 圆 
5 | turtle.circle(80) # 绘制 半径 为 80 像素 的 圆 
6 turtle.circle(160) # 绘制 半径 为 160 像素 的 圆 
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里 Python Turtle Graphics 


图 1.10 微 实 例 1.4 运行 后 输出 的 一 组 同 切 加 


【 微 实例 1.5】 日 期 和 时 间 的 输出 。 


输出 当前 计算 机 的 系统 日 期 和 时 间 。 交 互 式 执行 过 程 如 下 : 


微 实例 1.5 的 文件 式 内 容 如 下 : 


微 实例 1.5 ml.5PrintLocalDateTime.py 

1 | from datetime import datetime # 引用 datetime 库 

2 | now = datetime.now() # 获得 当前 日 期 和 时 间 信 息 

多 Print (now) 

4 | now.strftime("%x") # 输出 其 中 的 日 期 部 分 

5 | now.strftime("%X") # 输出 其 中 的 时 间 部 分 
思考 与 练习 


1.10 ”两 个 连续 的 print0 函 数 输出 内 容 一 般 会 分 行 显示 , 即 调用 print0 函 数 后 会 


-Re 
源 代码 1 一 6: 
日 期 和 时 间 的 输 
出 
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换行 并 结束 当前 行 ， 如 何 让 两 个 print0 函 数 的 输出 打印 在 一 行内 ? 
1.11 ”import 保留 字 用 来 引入 函数 库 ， 绘 制图 形 可 以 使 用 什么 Python 函数 库 ? 
1.12 ”获得 系统 的 日 期 和 时 间 使 用 什么 Python 函数 库 ? 


1.5 程序 的 基本 编写 方法 


ee 


So = 上 -= 


Ms ns 


1.5.1 ”IPO 程序 编写 方法 


每 个 计算 机 程序 都 用 来 解决 特定 计算 问题 。 较 大 规模 的 程序 提供 丰富 的 功能 解 
决 完整 的 计算 问题 ， 例 如 ， 控 制 航天 飞机 运行 的 程序 、 操 作 系 统 等 ， 小 型 程序 或 程 
序 片 段 可 以 为 其 他 程序 提供 特定 计算 支持 ， 作 为 解决 更 大 计算 问题 的 组 成 部 分 。 无 
论 程 序 规 横 如何， 每 个 程序 都 有 统一 的 运算 模式 : 输入 数据 、 处 理 数据 和 输出 数据 。 
这 种 朴素 运算 模式 形成 了 基本 的 程序 编写 方法 : IPO (Input, Process, Output) 方法 。 

输入 〈Input) 是 一 个 程序 的 开始 。 程 序 要 处 理 的 数据 有 多 种 来 源 ， 因 此 形成 了 
多 种 输入 方式 ， 包 插 文 件 输入 、 网 络 输入 、 控 制 台 输入 、 交 互 界面 输入 、 随 机 数据 
输入 、 内 部 参数 输入 等 。 

(1) 文件 输入 : 将 文件 作为 程序 输入 来 源 。 在 获得 文件 控制 权 后 ， 需 要 根据 文 
件 格式 解析 内 部 具体 数据 。 例 如 ， 统计 Excel 文件 数据 的 数量 ,需要 首先 获得 Excel 
文件 的 控制 权 ， 打 开 文 件 后 根据 Excel 中 数据 存储 方式 获得 所 需 处 理 的 数据 ， 进 而 
开展 计算 。7.1 节 将 具体 介绍 文件 的 使 用 。 

(2) 网 络 输入 : 将 互联 网 上 的 数据 作为 输入 来 源 。 使 用 网 络 数据 需要 明确 网 络 
协议 和 特定 的 网 络 接口 。 例 如 ， 捕 获 并 处 理 互 联网 上 的 数据 ， 需 要 使 用 协议 HTTP 
并 解析 HTML 格式 。 第 10 章 将 介绍 网 络 爬 虫 的 原理 和 方法 。 

(3) 控制 台 输入 : 将 程序 使 用 者 输入 的 信息 作为 输入 来 源 。 当 程序 与 用 户 间 存 
在 交互 时 , 程序 需要 有 明确 的 用 户 提 示 ， 辅助 用 户 正 确 输 入 数据 。 从 程序 语法 来 说 ， 
这 种 提示 不 是 必需 的 ， 但 良好 的 提示 设计 有 助 于 提高 用 户 体验 。 

(4) 交互 界面 输入 : 通过 提供 一 个 图 形 交 互 界 面 从 用 户 处 获得 输入 来 源 。 此 时 ， 
鼠标 移动 或 单 | 双击 操作 、 文 本 框 内 的 键盘 操作 等 都 为 程序 提供 输入 的 方式 。 

(5) 随机 数据 输入 : 将 随机 数 作为 程序 输入 ， 这 需要 使 用 特定 的 随机 数 生成 器 
星 序 或 调用 相关 函数 。4.5 节 将 详细 介绍 产生 随机 数 的 方法 。 

(6) 内 部 参数 输入 : 以 程序 内 部 定义 的 初始 化 变量 为 输入 ， 尽 管 程序 看 似 没有 
从 外 部 获得 输入 ， 但 程序 执行 之 前 的 初始 化 过 程 为 程序 赋予 了 执行 所 需 的 数据 。 

输出 Output) 是 程序 展示 运算 成 果 的 方式 。 程 序 的 输出 方式 包括 控制 台 输 出 、 


第 1 章 程序 设计 基本 方法 23 


图 形 输出 、 文 件 输出 、 网 络 输出 、 操 作 系 统 内 部 变量 输出 等 。 

(1) 控制 台 输 出 ， 以 计算 机 屏幕 为 输出 目标 ， 通 过 程序 运行 环境 中 的 命令 行 打 
印 输出 结果 。 这 里 “控制 台 ” 可 以 理解 为 启动 程序 的 环境 ， 例 如 ，Windows 中 的 命 
令 行 工 具 、IDLE 工具 等 。 

(2) 图 形 输出 : 在 计算 机 中 启动 独立 的 图 形 输 出 窗口 , 根据 指令 绘制 运算 结果 。 
第 9 章 将 介绍 高 级 人 机 交互 方法 。 

(3) 文件 输出 以 生成 新 的 文件 或 修改 已 有 文件 方式 输出 运行 结果 ， 这 是 程序 
常用 的 输出 方式 。7.1 节 将 具体 介绍 文件 的 使 用 。 

(4) 网 络 输出 : 以 访问 网 络 接口 方式 输出 数据 。 第 10 章 将 介绍 自动 向 搜索 引擎 
提交 关键 词 查询 的 实例 。 

(5) 操作 系统 内 部 变量 输出 指 程序 将 运行 结果 输出 到 系统 内 部 变量 中 ， 这 类 
变量 包括 管道 、 线 程 、 信 号 量 等 。 

处 理 (Process) 是 程序 对 输入 数据 进行 计算 产生 输出 结果 的 过 程 。 计 算 问 题 的 
处 理 方 法 统称 为 “算法 ” 它 是 程序 最 重要 的 组 成 部 分 。 可 以 说 ， 算 法 是 一 个 程序 的 
灵魂 。 

一 一 是 否 存在 没有 输入 输出 的 程序 呢 ? 

一 一 存在 ， 例 如 ， 无 限 循 环 ， 代 码 如 下 : 


L while (True) : 
2 a=1 


这 个 无 限 循 环 程序 包含 两 行 语句 ， 其 中 ，while(0) 根 据 括号 内 部 值 的 真 假 决 定 是 
否 进入 循环 ， 当 括号 内 值 为 真 时 ， 进 入 第 2 行 语句 执行 ， 否 则 跳 过 。 由 于 括号 内 值 
被 设 定 为 True〈 即 真 )， 代 码 将 一 直 执行 下 去 。 

无 限 循环 程序 尽管 没有 输入 也 没有 输出 ， 它 也 有 价值 。 通 过 不 间断 执行 ， 该 程 
序 快速 消耗 CPU 的 计算 资源 ， 可 以 用 来 辅助 测试 CPU 或 系统 性 能 。 尽 管 如 此 ， 这 
类 没有 输入 输出 的 程序 在 功能 上 十 分 有 限 ， 仅 在 特殊 情况 下 使 用 。 

IPO 不 仅 是 程序 设计 的 基本 方法 ， 也 是 描述 计算 问题 的 方式 。 以 微 实例 1.1 圆 
面积 的 计算 为 例 ， 其 IPO 描述 如 下 。 

输入 : 圆 半 径 raduis 

处 理 : 计算 圆 面积 area = x * radius * radius 

此 处 ， 关 取 3.141 5 

输出 : 圆 面积 area 

可 以 看 到 ， 问 题 的 IPO 描述 实际 上 是 对 一 个 计算 问题 输入 、 输 出 和 求解 方式 的 
自然 语言 描述 , 为 了 区 别 于 其 他 描述 方式 , 本 书 中 所 有 IPO 描述 都 包括 “输入 ”“ 处 
理 ” 和 “输出 ”3 个 引导 词 。 

IPO 描述 能 够 帮助 初学 程序 设计 的 读者 理解 程序 设计 的 开始 过 程 ， 即 了 解 程序 
的 运算 模式 , 进而 建立 设计 程序 的 基本 概念 。IPO 方法 是 非常 基本 的 程序 设计 方法 ， 
随 着 学 习 深入 ， 本 书 第 8 章 将 从 设计 思想 入 手 介绍 程序 设计 方法 论 ， 建 立 对 较 大 规 
模 程 序 框架 的 理解 。 
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1.5.2 理解 问题 的 计算 部 分 


编写 程序 的 目的 是 “使 用 计算 机 解决 问题 ”。 一 般 来 说 ,“ 使 用 计算 机 解决 问题 ” 
可 以 分 为 如 下 6 个 步骤 。 

(1) 分 析 问 题 ， 分 析 问 题 的 计算 部 分 : 首先 必须 明确 ， 计 算 机 只 能 解决 计算 问 
题 ， 即 解决 一 个 问题 的 计算 部 分 。 清 楚 理 解 所 需 解决 问题 的 计算 部 分 十 分 重要 ， 这 
是 利用 计算 机 解决 问题 的 前 提 ， 对 计算 部 分 的 不 同 理解 会 产生 不 一 样 的 程序 。 

例如 ， 本 书 每 章节 后 都 有 若干 道 程序 练习 题 ， 如 果 本 书 被 当 作 教材 ， 教 师 们 可 
能 会 根据 这 些 习 题 布 置 课 后 作业 ， 此 时 ， 一 些 读者 可 能 会 思考 这 样 的 问题 : 如 何 由 
计算 机 辅助 求解 习题 答案 并 完成 作业 ? 对 这 个 问题 的 分 析 和 理解 可 以 有 多 个 角度 。 

第 一 ， 对 于 作业 中 的 数学 计算 ， 可 以 编写 程序 辅助 完成 ， 但 利用 哪些 计算 公式 
则 由 读者 自己 选择 或 设计 。 此 时 , 该 问题 的 计算 部 分 表现 为 对 某 些 数学 公式 的 计算 。 

第 二 ， 可 以 利用 互联 网 搜索 课 后 练习 题 答 案 ， 根 据 搜 索 结 果 完 成 作业 。 为 了 降 
低 网 络 答案 错误 的 风险 ， 可 以 通过 计算 机 辅助 获得 多 份 答 案 并 选择 结果 一 致 数量 最 
多 的 答案 作为 “正确 ”答案 。 此 时 ， 该 问题 的 计算 部 分 表现 为 在 网 络 上 自动 搜索 多 
份 结果 并 输出 最 可 能 的 正确 结果 的 过 程 。 

第 三 ， 计 算 机 是 否 可 以 直接 理解 课 后 练习 题 并 给 出 答案 呢 ? 如 果 从 这 个 角度 出 
发 , 该 问题 的 计算 部 分 就 表现 为 计算 机 对 练习 题 的 理解 和 人 工 智能 求解 。 直到 今天 ， 
具有 高 度 智 能 的 计算 机 仍然 是 全 球 科学 家 共同 研究 的 目标 。 如 果 读 者 从 这 个 角度 分 
析 该 问题 的 计算 部 分 ， 恐 怕 将 无 法 在 短 时 间 内 提交 作业 了 。 


丘 展 : 人 工 智能 和 图 灵 测 试 
' 人工 智 能 ( Artificial Intelligence，AI) 是 计算 机 科学 的 一 个 分 支 ， 区 别 于 人 ; 
' 类 智能 ， 人 工 智能 指 由 机 器 或 软件 所 体现 的 智能 . “智能 ”这 个 概念 难以 确切 定 ， 
' 义 ， 因 此 ，1950 年 ， 计 算 机 科学 之 父 艾 伦 -图 灵 (Alan Turing ) 提出 了 著名 的 “图 ， 
' 灵 测 试 ?， 从 测试 角度 描述 智能 的 含义 。 图 灵 测 试 中 ， 机 器 和 人 分 别 通过 文本 途 ) 
; 径 (避免 计算 机 理解 语言 能 力 不 足 的 影响 ) 回答 一 组 由 独立 评判 人 提出 的 问题 ， 
' 如 果 评 判 人 无 法 从 回答 中 区 分 机 器 和 人 ， 则 认为 机 器 通过 测试 ， 具 备 与 人 相当 的 ， 
' 智能 。 图 灵 测试 并 不 评判 问题 答案 的 正确 性 ， 而 是 通过 评判 答案 之 间 的 相似 性 确 ; 
' 定 机 器 是 否 具备 智能 。 图 灵 测 试 是 人 工 智能 中 的 重要 概念 ， 也 是 商定 人 工 智能 发 ; 
! 展 的 重要 评判 基础 . 3 


这 个 例子 说 明 ， 对 一 个 问题 中 计算 部 分 ， 不 同 理解 将 产生 不 同 的 计算 问题 ， 也 
将 产生 不 同 功能 和 复杂 度 的 程序 。 如 何 更 好 地 理解 一 个 问题 的 计算 部 分 ， 如 何 有 效 
地 利用 计算 机 解决 问题 ， 这 不 只 是 编写 程序 的 问题 ， 而 是 更 重要 的 思维 问题 ， 即 计 
算 思 维 。 

(2) 划分 边界 ， 划 分 问题 的 功能 边界 : 计算 机 只 能 完成 确定 性 的 计算 功能 ， 因 
此 ， 在 分 析 问 题 计 算 部 分 的 基础 上 ， 需 要 精确 定义 或 描述 问题 的 功能 边界 ， 即 明确 
问题 的 输入 、 输 出 和 对 处 理 的 要 求 。 可 以 利用 IPO 方法 辅助 分 析 问 题 的 计算 部 分 ， 
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给 出 问题 的 IPO 描述 。 这 个 步骤 只 关心 功能 需求 ， 无 须 关 心 功能 的 具体 实现 方法 ， 
需要 明确 程序 的 输入 、 输 出 以 及 输入 输出 之 间 的 总 体 功能 关系 。 

(3) 设计 算法 ， 设 计 问 题 的 求解 算法 : 在 明确 处 理 功能 的 基础 上 ， 如 何 实现 程 
序 功能 呢 ? 这 需要 设计 问题 的 求解 算法 。 简 单 的 程序 功能 中 输入 和 输出 间 关 系 比 较 
直观 ， 程 序 结构 比较 简单 ， 直 接 选 择 或 设计 算法 即 可 。 对 于 复杂 的 程序 功能 ， 需 要 
利用 程序 设计 方法 将 “大 功能 ”划分 成 “小 功能 ” 或 者 将 功能 中 相对 独立 的 部 分 封 
装 成 具备 属性 和 操作 的 类 ， 并 在 各 功能 或 类 之 间 设 计 处 理 流程 。 对 于 “小 功能 ”或 
类 中 的 操作 ， 可 以 将 它们 看 成 一 个 新 的 计算 问题 ， 按 照 本 节 讲 述 的 步骤 逐 级 设计 和 
实现 。 更 多 有 关 程 序 设计 方法 的 内 容 将 在 第 8 章 介绍 。 

(4) 编写 程序 ， 编 写 问题 的 计算 程序 : 选择 一 门 编程 语言 ， 将 程序 结构 和 算法 
设计 用 编程 语言 来 实现 。 原 则 上 ， 任 何 通 用 编程 语言 都 可 以 用 来 解决 计算 问题 ， 在 
正确 性 上 没有 区 别 。 然 而 ， 不 同 编程 语言 在 程序 的 运行 性 能 、 可 读 性 、 可 维护 性 、 
开发 周期 和 调试 等 方面 有 很 大 不 同 .Python 语 言 相 比 C 语言 在 运行 性 能 上 略 有 逊色 ， 
不 适合 性 能 要 求 十 分 苛刻 的 特殊 计算 任务 ; 但 Python 程序 在 可 读 性 、 可 维护 性 和 开 
发 周期 等 方面 比 C 语言 有 更 大 优势 。 当 代 计 算 机 经 过 了 长 期 发 展 ， 性 能 远 超过 一 般 
功能 程序 的 使 用 需求 ，Python 语言 在 运行 性 能 方面 的 微弱 劣势 对 解决 一 般 问 题 十 分 
微不足道 。 

(5) 调试 测试 ， 调 试 和 测试 程序 ， 运行 程序 ， 通 过 单元 测试 和 集成 测试 评估 程 
序 运 行 结果 的 正确 性 。 一 般 来 说 ， 程 序 错误 通常 称 为 bug) 与 程序 规模 成 正比 。 
即使 经 验 丰富 的 程序 员 编 写 的 程序 也 会 存在 bug， 不 同 只 在 于 bug 数量 的 多 少 和 发 


现 的 难 易 。 为 此 ， 找 到 并 排除 程序 错 i 必要 ， 这 个 过 程 称 为 调试 (通常 称 为 


Debug )。 
当 各 下 网 运行 局 ) 可 以 有 用 更 过 测 二 发现 和 认 在 各 和 情况 下 的 给 点 ， 鲍 如， 
压力 测试 能 运行 速度 的 最 大 值 和 稳定 运行 的 性 能 边界 ， 安 全 性 测试 能 够 


发 现 程序 漏洞 ， 界 定 程序 安全 边界 ， 进 而 指导 程序 在 合理 范围 内 使 用 。 

(6) 升级 维护 ， 适 应 问题 的 升级 维护 : 任何 一 个 程序 都 有 它 的 历史 使 命 ， 在 这 
个 使 命 结束 之 前 ， 随 着 功能 需求 、 计 算 需求 和 应 用 需求 的 不 断 变 化 ， 程 序 将 不 断 地 
升级 维护 ， 以 适应 这 些 变化 。 

综 上 所 述 ， 解 决 计算 问题 包括 6 个 步骤 : 分 析 问 题 、 划 分 边界 、 设 计算 法 、 编 
写 程序 、 调 试 测试 和 升级 维护 。 其 中 ， 与 程序 设计 语言 和 具体 语法 有 关 的 步骤 是 编 
写 程序 和 调试 测试 。 可 见 ， 在 解决 计算 问题 过 程 中 ， 编 写 程序 只 是 一 个 环节 。 在 此 
之 前 ， 分 析 问 题 、 划 分 边界 和 设计 算法 都 是 重要 步骤 ， 经 过 这 些 步骤 ， 一 个 计算 问 
题 已 经 能 够 在 设计 方案 中 被 解决 了 ， 这 个 过 程 可 以 看 作 是 计算 思维 的 创造 过 程 ; 编 
写 程序 和 调试 测试 则 是 对 解决 方案 的 计算 机 实现 ， 属 于 技术 实现 过 程 。 


思考 与 练习 

1.13 ”针对 如 下 计算 问题 ,测试 一 台 机 器 是 否 真正 拥有 人 类 的 智能 。 请 用 IPO 
方法 描述 该 问题 的 解决 方案 。( 参 考 图 灵 测 试 ) 

1.14 解决 计算 问题 过 程 中 ， 哪 些 步 又 中 可 能 用 到 Python 语言 ? 
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1.15 ”调试 和 测试 有 什么 区 别 和 联系 ? 
1.16 ”下面 不 是 .了 了 O 模 动 的 一 部 分 的 是 ' 亿 ， / 
人 Proceys Do 


A. Input / B. Program 
eg 


1.6 Python 语言 的 版 本 更 迭 


此。 Python 2.x 已 经 是 遗产 ， python 3x 是 这 个 话 计 的 现在 和 未 来 。 ， 


= - 


1.6.1 版 本 之 间 的 区 别 


2010 年 , Python 2.x 系列 发 布 了 最 后 一 个 版 本 , 其 主 版 本 号 为 2.7, 同时 , Python 
维护 者 们 声称 不 在 2.x 系列 中 继续 进行 主 版 本 号 升级 。 Python 2.x 系列 已 经 完成 了 它 
的 使 命 ， 逐 步 退 出 历史 有 舞台 。 

2008 年 ，Python 3.x 第 一 个 主 版 本 发 布 ， 其 主 版 本 号 为 3.0， 并 作为 Python 语 
言 持续 维护 的 主要 系列 。 该 系列 在 2012 年 推出 3.3 版 本 , 2014 年 推出 3.4 版 本 , 2015 
年 推出 3.5 版 本 ,2016 年 推出 3.6 版 本 。 目前, 主要 的 Python 标准 库 更 新 只 针对 3.x 
系列 。 

Python 3.x 是 Python 语言 的 一 次 重大 升级 ， 它 不 完全 向 下 兼容 2.x 系列 程序 。 
在 语法 层面 ，3.x 系列 继承 了 2.x 系列 绝 大 多 数 的 语法 表达 ， 只 是 移 除 了 部 分 混淆 的 
表达 方式 。 对 于 程序 设计 初学 者 来 说 ， 两 者 的 差距 很 小 ， 学 会 3.x 系列 也 能 看 懂 2.x 
系列 语法 。 

学 习 Python 语言 不 免 会 看 到 一 些 2.x 系列 的 程序 ， 为 了 让 读者 能 看 懂 2.x 系列 
程序 代码 ， 这 里 仅 列 出 本 书 涉及 内 容 中 两 个 系列 语法 的 一 些 区 别 〈 更 多 区 别 请 查看 
Guido 的 文章 : https://docs.python.org/3/whatsnew/3.0.html)。 

(1) 修改 编码 : 3.x 系列 默认 采用 UTF-8 编码 ， 因 此 处 理 中 文 与 英文 一 样 方便 。 
而 且 ， 在 表达 UTF-8 编码 字符 串 时 ， 不 需要 在 前 面 增加 ua 或 者 U。 

(2) 修改 print 语句 : 用 printO) 函 数 替 换 了 print 语句 ， 两 者 功能 一 样 ， 格 式 不 
同 ， 例 如 : 


人 


(3) 修改 exec 语句 : 用 exec0 函 数 替 换 了 exec 语句 , 两 者 功能 一 样 , 格式 不 同 。 
(4) 去 掉 <> 符 号 : 用 != 表 示 “ 不 等 于 ”。 
(5) 修改 比较 行为 : 用 <、<=、>=、> 符 号 比较 两 个 元 素 时 ， 如 果 元 素 之 间 不 存 
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在 有 意义 的 顺序 关系 ， 将 抛 出 TypeError 错误 ， 不 再 返回 False， 例 如 : 


(6) 去 掉 长 整数 类 型 : Python 3.x 系列 不 再 区 分 整数 类 型 ， 只 有 一 个 


int 类 型 ， i 国 才 ; Sys. We 常量 被 去 掉 。 
法 : | > : ™ 
想 ; | : 


(8) 修改 八进制 整数 格式 : ， 例 如 ，0o237， 


而 不 是 0237。 
(9) 增加 关键 字 : 增加 as、with、True、False、None 作为 关键 字 。 
(10) 天 荐 Tw input0 函 数 : 用 input0 蔡 代 raw_input0，inputO 返 回 一 个 字符 串 。 
TW DU UE 
(11) 修改 range0 〇 函数， range() 功 能 与 Python 2.x 系列 中 xrange0 类 似 ， 不 再 显 
式 返 回 一 个 列表 。 如 果 希 望 返回 列表 ， 需 要 通过 list0 了 数 转换 ， 讽 姑 : 


(12) 修改 返回 类 型 : 除 range0 外 ， zip()、map()、filter()、 字 上 典 类 型 的 key0 方 


法 、value() 方 法 、itemO) 再 返回 列表 类 型 。 
C13) 修改 异常 处 理 表达 : 使 用 as 关 丛 字 标 识 异常 信息 ， 例 如 : 
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晴晴 向 后 兼容 

向 后 半 窜 (Backward Compatibiliy )， 也 称 为 向 下 兼容 ， 是 系统 、 产 品 或 技术 ， 
的 一 个 特性 ， 用 来 描述 一 个 新 改进 版 本 的 系统 、 产 品 或 技术 继续 同 旧 的 、 功能 天， 
的 版本 一 同 工 作 的 能 力 ， 简单 说 它 指 新 版 本 可 以 兼容 或 者 葵 代 旧版 本 。 对 于 |; 
! Python 语言 来 说 ，Python 3.x 解释 器 不 能 不 加 修改 地 运行 n 
! 编写 的 程序 ，Python 3. 版 玉 并 不 向 后 兼容 Pyihon 2 县 本 | 
向 后 兼容 对 产品 和 系统 发 展 来 说 十 分 有 益 ， 因 为 用 户 可 以 无 须 了 解 产 品 升级 ， 
! 的 细节 而 使 用 新 版 本 继续 运行 原 有 程序 。 因此， 几乎 所 有 重要 系统 或 产品 都 向 后 ， 
! 兼容 。 例 如 ，Intel 公司 最 新 款 CPU 仍然 能 够 运行 最 早期 80486 指令 集 编写 的 程 ， ' 
' 序 , 微软 公司 最 新 的 Windows 操作 系统 能 够 运行 早期 Windows XP 系统 上 的 可 执 ; ! 
! ! 行文 件 。 Python 语言 不 选择 向 后 兼容 ， 是 Guido 对 Python 语言 发 展 做 出 的 最 重 ， 
! 大 的 决定 ， 虽 然 短 期 内 带 来 升级 函数 库 的 巨大 代价 ， 但 长 期 来 看 ， 由 于 不 需要 兼 
容 旧 有 版 本 ， 新 版 本 语言 有 助 于 简化 解释 器 功能 ， 释 放 Python Wn : 

! 包容 。 


1.6.2 版 本 的 选择 建议 


一 一 Python 学 习 者 该 学 习 哪 个 Python 版 本 呢 ? 

一 一 除了 一 些 特殊 情况 ， 请 学 习 Python 3.x 版 本 。 

对 于 初次 接触 Python 语言 的 读者 ， 请 学 习 Python 3.x 系列 版 本 。 Python 版 本 更 
帮 已 达 8 年 以 上 , 目前 , 全 部 的 标准 库 和 绝 大 多 数 第 三 方 库 都 很 好 地 支持 Python 3.x 
系列 ， 并 在 该 系列 基础 上 升级 更 新 。 

尽管 现在 大 多 数 Linux 和 Mac OS 系统 在 发 布 中 仍然 默认 集成 Python 2.x 系列 
版 本 ,但 Python 3.x 系列 已 经 非常 成 熟 和 稳定 。 部 分 Linux 和 Mac OS 系统 通过 
Python3 命令 同时 提供 对 Python 3.x 系列 的 支持 。 

但 是 ， 在 直到 以 下 问题 时 ， 请 考虑 使 用 Python 2.x 版 本 。 

(1) 所 面 对 的 开发 环境 已 经 部 署 好 ， 并 且 采 用 Python 2.x， 在 无 法 选择 开发 环 
境 的 情况 下 ， 请 使 用 Python 2.x 版 本 。 

(2) 如 果 希 望 使 用 一 个 特定 的 第 三 方 库 ， 且 这 个 库 不 提供 Python 3.x 版 本 (一 
般 来 说 ， 这 类 库 都 已 经 多 年 无 人 维护 )， 请 使 用 Python 2.x 版 本 。 
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总 的 来 说 ， 如 果 可 以 自主 选择 版 本 且 所 使 用 的 库 或 已 有 代码 有 Python 3.x 的 支 
持 ， 请 选择 Python 3.x 版 本 。 基 于 上 述 考 虑 ， 本 书 以 Python 3.x 为 教学 内 容 ， 也 请 
读者 选择 Python 3.x 版 本 。 


思考 与 练习 

1.17 打印 输出 (print) 是 程序 常用 功能 ， 观 察 Python 2.x 和 Python 3.x 版 本 在 
这 个 功能 上 的 不 同 。 

1.18 ”获得 用 户 输 入 (input) 也 是 程序 常用 功能 ， 观 察 Python 2.x 和 Python 3.x 
版 本 在 这 个 功能 上 的 不 同 。 

1.19 如 何 快速 判断 一 个 Python 代码 是 Python 3.x 版 本 。 


本 章 具体 讲解 了 计算 机 的 基本 定义 、 计 算 机 的 功能 性 和 可 编程 性 、 程 序 设计 语 
言 分 类 、 编 译 和 解释 、Python 语言 的 历史 和 发 展 、 配 置 Python 开发 环境 等 内 容 ， 最 。 程序 练习 1-1， 
后 给 出 了 Python 版 本 的 主要 区 别 供 读者 参考 。 1 ho 


程序 练习 是 


由 于 本 章 尚 未 开始 讲解 Python 语言 语法 , 请 读者 在 Python 3.x 环境 中 运行 下 列 
程序 了 解 Python 语言 ， 熟 练 掌握 Python 语言 的 开发 和 运行 环境 。 

1.1 字符 串 拼 接 。 接 收 用 户 输入 的 两 个 字符 串 ， 将 它们 组 合 后 输出 。 
strl = input (" 请 输入 一 个 人 的 名 字 : ") 


str2 = input(" 请 输入 一 个 国家 名 字 : ") 
Print ("世界 这 么 大 ，{} 想 去 {]} 看 看 。" . format (str1,str2) ) 


2 
3 


1.2 ”整数 序列 求 和 。 用 户 输入 一 个 正 整数 W， 计 算 从 1 到 N (包含 1 和 NN) 相 
加 之 后 的 结果 。 


n = input ("请 输入 整数 N: ") 


| sum = 0 


sum += 工 十 工 


Print("1 到 N 求 和 结果 : "， sum) 


工 

之 

3 ] for i in zange(int(n) ) : 
4 | 

5 | 
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1.3” 九 九 乘法 表 输出 。 工 整 打印 输出 常用 的 九 九 乘法 表 ， 格 式 不 限 。 


于 for i in range (1,10) : 

2 for j in range(l1,i+1): 

3 print("{}*{}={:2} ".format (j,i,ixj), end="'') 
4 print('') 


1.4 计算 1+2!+3!+…+10! 的 结果 。 


1 sum, tmp = 0, 1 

2 for i in range(1,11): 

3 tmp*=i 

4 sum+=tmp 

5 | print ("运算 结果 是 : {}".format (sum)) 

1.5 ”猴子 吃 桃 问题 ， 猴 子 第 一 天 摘 下 若干 个 桃子 ， 当 即 吃 了 一 半 ， 还 不 过 冶 ， 
又 多 吃 了 一 个 ; 第 二 天 早上 又 将 剩 下 的 桃子 吃 掉 一 半 ， 又 多 吃 了 一 个 。 以 后 每 天 早 
上 都 吃 了 前 一 天 剩 下 的 一 半 多 一 个 。 到 第 五 天 早上 想 再 吃 时 ， 见 只 剩 下 一 个 桃子 了 。 


请 编写 程序 计算 猴子 第 一 天 共 摘 了 多 少 桃子 。 


n=1 


4 
for i in range(5,0,-1): 
3 n= (n+1)<<1 

4 


| Print (n) 
1.6 ”健康 食谱 输出 。 列 出 5 种 不 同 食材 ， 输 出 它们 可 能 组 成 的 所 有 菜 式 名 称 。 
diet = [' 西 红 柿 '，' 花 椰 菜 ' ，' 黄 瓜 '，' 牛 排 '，' 虾 仁 '] 


| for x in range(0, 5): 


下 

2 

9 for y in range(0, 5): 
a if not(x == y): 

5 


print("{}{}".format (diet[x], diet[y])) 


五 角 星 的 绘制 : 绘制 一 个 红色 的 五 角 星 图 形 ， 如 图 1.11 所 示 。 


ee] 


from turtle import * 
£fillcolor ("red") 
begin fill() 


> 
while True: 
forward (200) 


right (144) 
if abs(pos()) < 1: 
break 
end £fill() 


(© © mm Un ND 全 


图 1.11 五 角 星 的 绘制 结果 
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1.8 太阳 花 的 绘制 : 绘制 一 个 太阳 花 的 图 形 ， 如 图 1.12 所 示 。 


from turtle import * 
color('red', 'yellow') 
begin fill() 
while True: 

forward (200) 

left (170) 

if abs (Pos()) < 1: 

break 

end fill() 


done () 


OO mm oo BB WD bP 
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图 1.12 太阳 花 的 绘制 结果 
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MEN SE 
Talk is cheap. Show me the code. 
一 一 林 纳 斯 。 托 瓦 效 (Linus Torvalds) 
Linux 操作 系统 的 葛 基 者 


! (GD 掌握 解决 计算 问题 的 一 般 方法 。 

， 02) 掌握 Python 语言 的 基本 语法 ， 包 括 缩 进 、 变 量 、 命 名 等 。 
: (3) 掌握 Python 语言 绘制 图 形 的 一 般 方法 。 

: (4) 了 解 Python 标准 库 的 导入 和 使 用 。 


Vo 2200002208 oo 


Python 创始 人 Guido 大 牛 是 英国 Monty Python 六 人 组 合 的 忠实 粉丝 ， 因 此, 他 
将 创建 的 编程 语言 起 名 为 Python。 尽 管 Guido 起 名 的 本 意 与 蟒蛇 无 关 ， 但 世界 各 地 
忠实 的 Python 程序 员 仍 将 蟒蛇 当 作 该 语言 的 吉祥 物 。 本 章 将 为 读者 讲解 如 何 使 用 
Python 标准 库 快速 绘制 一 条 能 够 仆 行 的 彩色 大 蜡 蛇 。 

向 Guido 致敬 、 向 创新 致敬 ! 


电子 教案 2=1 


Python 程序 实例 | 
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本 节 以 温度 转换 问题 为 例 , 介绍 程序 设计 的 基本 方法 , 并 给 出 Python 语言 的 有 具 
体 实现 。 

温度 的 刻画 有 两 个 不 同体 系 : 摄氏 度 〈Celsius) 和 华氏 度 (Fabrenheit)。 摄 氏 
度 以 1 标准 大 气压 下 水 的 结 冰点 为 0 度 ， 沸 点 为 100 度 ， 将 两 个 温度 区 间 进 行 100 
等 分 后 确定 1 度 所 代表 的 温度 区 间 ， 进 而 刻画 温度 值 。 华 氏 度 以 1 标准 大 气压 下 水 
的 结 冰 点 为 32 度 ,沸点 为 212 度 ,将 两 个 温度 区 间 进 行 180 等 分 后 定义 为 1 度 区 间 。 
华氏 度 的 1 度 比 摄氏 度 的 1 度 所 对 应 温度 区 间 更 小 ， 所 以 华氏 度 体系 更 为 细致 。 由 
于 历史 原因 ， 不 同 国家 可 能 采用 不 同 的 温度 表示 方法 ， 例 如 ， 中 国 采 用 摄氏 度 ， 美 
国 采 用 华氏 度 。 

对 于 去 美国 旅行 的 中 国 游客 来 说 ， 需 要 将 当地 发 布 的 华氏 温度 转换 为 摄氏 温度 
以 符合 自己 的 理解 习惯 ; 同样 ， 来 中 国旅 行 的 美国 游客 ， 也 需要 将 当地 发 布 的 摄氏 
温度 转换 为 华氏 温度 。 问 题 是 ， 如 何 利用 计算 机 程序 辅助 旅行 者 进行 温度 转换 ? 

根据 第 1 章 介 绍 的 程序 编写 基本 方法 ， 用 计算 机 解决 上 述 问题 需要 6 个 步骤 ， 
分 析 和 实现 过 程 如 下 。 

(1) 分 析 问 题 : 可 以 从 很 多 不 同 角度 来 理解 旅行 者 温度 转换 问题 的 计算 部 分 。 
这 里 给 出 3 个 角度 。 第 一 ， 利 用 程序 进行 温度 转换 ， 由 用 户 输入 温度 值 ， 程 序 给 出 
输出 结果 。 这 是 最 直观 的 理解 。 第 二 ， 可 以 通过 语音 识别 、 图 像 识 别 等 方法 自动 监 
听 并 获得 温度 信息 发 布 渠道 (如 收音 机 、 电 视 机 等 ) 给 出 的 温度 播报 源 数据 ， 再 由 
程序 转换 后 输出 给 用 户 。 这 种 角度 相 比 第 一 种 不 需要 用 户 给 出 输入 。 第 三 ， 随 着 互 
联网 的 高 度 普 及 和 接 入 的 便捷 ， 程 序 也 可 以 定期 从 温度 信息 发 布 网 站 获得 温度 值 ， 
再 将 温度 信息 转换 成 旅行 者 熟悉 的 方式 。3 种 角度 对 问题 计算 部 分 的 不 同 理解 会 产 
生 不 同 的 IPO 描述 、 算 法 和 程序 。 应 该 说 ,“ 利 用 计算 机 解决 问题 ”需要 结合 计算 
机 技术 的 发 展 水 平和 人 类 对 问题 的 思考 程度 ， 在 特定 技术 和 社会 条 件 下 ， 分 析出 一 
个 问题 最 经 济 、 最 合理 的 计算 部 分 ， 进 而 用 程序 实现 。 本 文 以 第 一 种 理解 角度 为 例 
编写 并 讲解 余下 程序 步骤 。 

(2) 划分 边界 : 在 确定 问题 计算 部 分 的 基础 上 进一步 划分 问题 边界 ， 即 明确 问 
题 的 输入 数据 、 输 出 数据 和 对 数据 处 理 的 要 求 。 由 于 程序 可 能 接收 华氏 温度 和 摄氏 
温度 ， 并 相互 转换 ， 该 功能 的 IPO 描述 如 下 。 

输入 : 带 华氏 或 摄氏 标志 的 温度 值 

处 理 : 根据 温度 标志 选择 适当 的 温度 转换 算法 

输出 带 摄氏 或 华氏 标志 的 温度 值 
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这 里 采用 82F 表示 华氏 82 度 ， 采 用 28C 表示 摄氏 28 度 ， 实 数 部 分 是 温度 值 。 
这 种 温度 表示 格式 同时 用 于 温度 的 输入 和 输出 。 

(3) 设计 算法 : 根据 华氏 和 摄氏 温度 定义 ， 两 个 温度 体系 都 以 1 标准 大 气压 下 
水 的 结 冰点 和 沸点 为 温度 区 间 边 界 ， 因 此 ， 转 换算 法 如 下 : 


= (EF = 32)7L.8 
F = C*l1.8 + 32 


ki a F 表示 华氏 温度 。 


人 各 二 AI 是 区 家 从 于 守 且 庆 人 币 守 所 本 二 于 区 二 而 用 要 、 
; 作 。 在 IPO 模式 中 ， 确 定 输入 和 输出 后 ， 处 理 过 程 通常 也 称 为 算法 。 算 法 的 理解 ， 
; 有 广义 和 狭义 之 分 。 广义 上 ， 任 何 完成 计算 功能 的 一 组 操作 都 可 以 称 为 算法 ， 这 ， 
! 组 操作 可 以 对 应 单一 的 计算 问题 ， 也 可 以 对 应 多 个 计算 问题 的 组 合 ; 狭义 上 ， 算 ， 
;法 通常 针对 单一 计算 问题 ， 例 如 ， 针 对 优化 求解 问题 的 贪 禁 算 法 、， 遍 历 树 结构 的 ， 
' 深度 优先 算法 等 。 


(4) 编写 程序 : 根据 IPO 描述 和 算法 设计 ， 编 写 如 下 温度 转换 的 Python 程序 
代码 : 


实例 代码 1.1 el.1TempConvert.py 
下 


#el.1lTempConvert.py 
TempStz = input ("请 输入 带 有 符号 的 温度 值 : ") 
if Tempstr[-1] in ['F','f']: 
C= (evall(TempStr[0:-1]) - 32)/1.8 
print ("转换 后 的 温度 是 {: .2f}C" .format (Cc)) 
elif TempStr[-1] in ['C','c']: 
F = 1.8*eval (TempStr[0:-1]) + 32 
Print ("转换 后 的 温度 是 {: .2£f}F" .format (F)) 
else: 


Print ("输入 格式 错误 ") 


WW mA UR WD Pb- 


片 
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此 时 看 不 懂 上 述 代码 没关系 ，2.2 节 将 逐 行 解 释 上 述 代码 的 含义 。 

(5) 调试 测试 : 将 上 述 程序 保存 为 文件 : el.1TempConvert.py， 采 用 1.4 节 介绍 
的 方法 ， 使 用 IDLE 运行 该 程序 。 输 出 和 交互 输入 如 下 M1。 

输入 带 华氏 标志 的 温度 值 ， 程 序 运行 结果 如 下 : 


[1] 本 书 中 ， 交 互 代 码 中 的 黑体 字 表 示 用 户 输入 信息 。 


Hh 
图 片 资料 2 一 1 
iPython 快速 参考 
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输入 带 摄氏 标志 的 温度 值 ， 程 序 运 行 结果 如 下 : 


上 述 程 序 符合 Python 语法 ， 执 行 结果 正确 。 事 实 上 ， 当 程序 较为 复杂 时 ， 很 难 
保证 一 次 编写 后 的 程序 能 够 直接 正确 运行 或 运行 逻辑 没有 错误 。 甚 至 说 ， 任 何 程序 
都 会 有 错误 。 寻 找 错误 的 调试 过 程 不 容 忽视 。 

(6) 升级 维护 : 与 人 一 样 ， 任 何 程序 都 有 生命 周期 。 促 使 程序 生命 结束 的 事件 
有 很 多 , 例如， 平台 更 换 、 使 用 方式 变化 、 算 法 改进 等 。 对 于 上 述 例子 ， 只 要 中 国 、 
美国 使 用 不 同 的 温度 标准 ， 温 度 转换 问题 将 一 直 存 在 。 随 着 问题 使 用 场景 、 输 入 和 
输出 要 求 等 因素 的 变化 ， 程 序 将 需要 不 断 地 维护 和 升级 。 


思考 与 练习 

2.1 公司 或 组 织 都 需要 对 资金 使 用 进行 管理 , 因此 需要 计算 机 辅助 进行 财务 统 
计 和 报表 分 析 。 请 从 不 少 于 3 个 角度 分 析 该 问题 的 计算 部 分 。 

2.2 《红楼 梦 三 国 演义 》 是 中 国 四 大 名 著 之 一 ， 该 书 描述 了 100 多 个 典型 人 物 。 
统计 书 中 典型 人 物 名 字 出 现 的 次 数 能 够 侧面 反映 人 物 的 重要 性 。 请 给 出 这 个 计算 问 
题 的 IPO 描述 ， 重 点 描述 其 中 的 算法 部 分 。6.6 节 将 给 出 统计 《三 国 演 义 》 中 人 物 
出 场次 数 的 程序 。 

2.3 ”程序 设计 不 能 解决 所 有 问题 。 例 如 ， 计 算 机 无 法 回答 如 下 这 些 问 题 : 你 最 
欣赏 的 历史 人 物 是 谁 ? 孙红雷 和 姚 晨 两 位 演员 ， 谁 的 演技 更 好 ? 创新 对 中 国 未 来 经 
济 的 价值 有 多 大 ? 请 讨论 总 结 ， 哪 些 类 型 的 问题 无 法 通过 程序 设计 解决 ? 


2.2 Python 程序 语法 元 素 分 析 


=~- 
》 


要 点 : Python 程序 包括 格式 框架 、 注 释 、 变 量 、 表 达 式 、 分 支 语 身 、 循 环 ! 
语 身 、 函 数 等 语法 元 素 . 


一 


程序 设计 的 6 个 步骤 是 利用 计算 机 解决 问题 的 方法 步骤 ， 程 序 设计 语言 则 是 解 
决 问题 的 实现 载体 。 本 节 以 实例 代码 1.1 为 例 ， 介 绍 Python 程序 中 各 组 成 部 分 ， 即 
语法 元 素 的 基本 含义 ， 使 读者 对 Python 程序 有 一 个 基本 的 理解 。 各 元 素 的 深入 介绍 
将 在 第 3 章 到 第 7 章 展开 。 


2.2.1 程序 的 格式 框架 


了 
于 
1 
1 
上 
、 


Ve 


Python 语言 采用 严格 的 “ 缩 进 ”来 表明 程序 的 格式 框架 。 缩 进 指 每 一 行 代码 开 
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始 前 的 空白 区 域 ， 用 来 表示 代码 之 间 的 包含 和 层次 关系 。 不 需要 缩 进 的 代码 项 行 纺 
写 ， 不 留 空白 。 代 码 编写 中 ， 缩 进 可 以 用 Tab 键 实现 ， 也 可 以 用 多 个 空格 一 般 是 
4 个 空格 ) 实现 ， 但 两 者 不 混用 。 建 议 采用 4 个 空格 方式 书写 代码 。_ 

严格 的 缩 进 可 以 约束 程序 结构 ， 有 利于 维护 代码 结构 的 可 读 性 。 例 如 ， 在 实例 
代码 1.1 的 10 行 代码 中 ， 第 4、5、7、8、10 行 存在 缩 进 ， 表 明 这 些 行 代码 在 逻辑 
上 属于 之 前 紧邻 的 无 缩 进 代码 行 的 所 属 范畴 。 

图 2.1(a) 给 出 了 实例 代码 1.1 的 缩 进 关系 ,其 中 箭头 表示 让 语句 与 后 面 语句 之 间 
单 层 缩 进 关系 。 除 了 单 层 缩 进 ， 一 个 程序 的 缩 进 还 可 “ 贬 套 ”从 而 形成 多 层 缩 进 ， 
图 2.1(b) 给 出 了 4.6 节 中 实例 代码 6.1 的 多 层 缩 进 关系 。Python 语言 对 语句 之 间 的 层 
次 关系 没有 限制 ， 可 以 “无 限制 ”机 套 使 用 。 


#el.1TempConvert .py 
Tempstr = input ("请 输入 带 有 符号 
if Tempstr{-1] in [’'F,'f£"]: 


C= (eval(TempSstr[0:-1]) - 
print ("转换 后 的 温度 是 { : .2f}C 


elif TempStr[-1] in [’'C','c'] 
F = 1.8*eval (Tempstr[0:—1] 
print ("转换 后 的 温度 是 { : .2f}F 
else: 


NA print (" 输 入 格式 错误 ") 
(a) 单 层 缩 进 


DARTS = 1000 

hits = 0.0 

clock() 

for i in range (1l, DARTS): 
x;: Y = random!(), random!(; 
dist = Sart(Xx 二 
if dist <= 1.0: 

~ hits = hits + 1 
pi = 4 * (hits/DARTS) 


print ("Pi 的 值 是 { : .2f}" .format 


(b) 多 层 缩 进 


图 2.1 Python 程序 的 格式 框架 


缩 进 表达 了 所 属 关 系 。 单 层 缩 进 代 码 属于 之 前 最 邻近 的 一 行 非 缩 进 代码 ， 多 层 
缩 进 代码 根据 缩 进 关系 决定 所 属 范围 。 需 要 注意 ， 不 是 所 有 代码 都 可 以 通过 缩 进 包 
含 其 他 代码 , 图 2.1(a) 所 示 的 缩 进 代 码 包 含 在 if-elif-else 这 种 判断 结构 中 ,一 般 来 说 ， 
判断 、 循 环 、 函 数 、 类 等 语法 形式 能 够 通过 缩 进 包 含 一 批 代 码 ， 进 而 表达 对 应 的 语 
义 。 但是， 如 print() 这 样 的 简单 语句 不 表达 包含 关系 ， 不 能 使 用 缩 进 。 


注释 是 程序 员 在 代码 中 加 入 的 一 行 或 多 行 信息 ， 用 来 对 语句 、 函 数 、 数 据 结构 
或 方法 等 进行 说 明 ， 提 升 代码 的 可 读 性 。 注释 是 辅助 性 文字 ， 会 被 编译 或 解释 器 略 
去 ， 不 被 计算 机 执行 。 例 如 ， 实 例 代 码 1.1 中 第 1 行 就 是 一 个 注释 。 


| #el.1TempConvert.py 


Python 语言 有 两 种 注释 方法 ， 单 行 注释 和 多 行 注释 。 单 行 注释 以 4 开头 ， 多 行 
注释 以 ”03 个 单 引号 ) 开头 和 结尾 。 例 如 ; 
ss 
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# 这 是 单行 注释 ， 单 行 注释 可 以 独占 一 行 

print (pow(2,10)) # 计算 2 的 10 次 方 ， 单行 注释 可 以 从 行 的 中 间 开 始 
print (pow (2,10)) 此 行 是 注释 ， 不 被 计算 机 执行 

此 行 也 是 注释 


GOn 忆 mW N 博 


Python 程序 中 的 非 注释 语句 将 按 顺序 执行 ， 而 注释 语句 则 被 解释 器 过 滤 掉 ， 不 
被 执行 。 本 书 中 完整 实例 程序 的 首 行 都 会 有 一 个 注释 行 ， 用 来 说 明 该 程序 保存 为 文 
件 时 建议 采用 的 名 字 ， 读 者 可 以 从 本 书 电子 资源 中 获取 同名 代码 文件 。 

注释 主要 有 3 个 用 途 。 第 一 ， 标 明 作 者 和 版 权 信息 。 在 每 个 源 代码 文件 开始 前 
增加 注释 ， 标 记 编 写 代码 的 作者 、 日 期 、 用 途 、 版 权 声 明 等 信息 ， 可 以 采用 单行 或 
多 行 注释 。 第 二 ， 解 释 代 码 原理 或 用 途 。 在 程序 关键 代码 附近 增加 注释 ， 解 释 关 键 
代码 作用 ， 增 加 程序 的 可 读 性 。 由 于 程序 本 身 已 经 表达 了 功能 意图 ， 为 了 不 影响 程 
序 阅 读 连贯 性 ， 程 序 中 的 注释 一 般 采 用 单行 注释 ， 标 记 在 关键 代码 同行 。 对 于 一 段 
关键 代码 ， 可 以 在 其 附近 采用 一 个 多 行 注释 或 多 个 单行 注释 给 出 代码 设计 原理 等 信 
息 。 第 三 ， 辅 助 程序 调试 。 在 调试 程序 时 ， 可 以 通过 单行 或 多 行 注释 临时 “去 掉 ” 
一 行 或 连续 多 行 与 当前 调试 无 关 的 代码 , 辅助 程序 员 找 到 程序 发 生 问题 的 可 能 位 置 。 


2.2.3 ”命名 与 保留 字 


与 数学 概念 类 似 ，Python 程序 采用 “变量 ”来 保存 和 表示 具体 的 数据 值 。 为 了 
更 好 地 使 用 变量 等 其 他 程序 元 素 , 需要 给 它们 关联 一 个 标识 符 (名 字 ), 关联 标识 符 
的 过 程 称 为 命名 。 命名 用 于 保证 程序 元 素 的 唯一 性 。 例 如, 实例 代码 1.1 中 , TempStr 
是 一 个 接收 输入 字符 串 的 变量 名 字 。 

Python 语言 允许 采用 大 写字 母 、 小 写字 母 、 数 字 、 下 画 线 _ 和 汉字 等 字符 及 其 
组 合 给 变量 命名 ， 但 名 字 的 首 字符 不 能 是 数字 ， 中 间 不 能 出 现 空格 ， 长 度 没 有 限 
制 趾 。 以 下 是 合法 命名 的 标识 符 : 


python is good, python is not good, is it a question 


喜欢 Python 语言 、 我 喜欢 这 本 Python 书籍 

注意 : 标识 符 对 大 小 写 敏感 ，python 和 Python 是 两 个 不 同 的 名 字 。 

一 般 来 说 ， 程 序 员 可 以 为 程序 元 素 选 择 任何 喜欢 的 名 字 ， 但 这 些 名 字 不 能 与 
Python 的 保留 字 相 同 。Python 3.x 版 本 共有 33 个 保留 字 ， 如 表 2.1 所 示 。 与 其 他 标 
识 符 一 样 ，Python 的 保留 字 也 对 大 小 写 敏感 。 例 如 ，for 是 保留 字 ， 而 For 则 不 是 ， 
程序 员 可 以 定义 其 为 变量 使 用 。 


[1] 实际 上 ， 受 限于 计算 机 存储 资源 ，Python 语言 中 定义 的 名 字 是 有 长 度 限 制 的 ， 但 这 种 限 
制 只 是 计算 机 资源 层面 的 限制 ， 从 语法 上 没有 限制 。 
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: A 指 被 编程 语言 内 部 定义 并 保留 使 用 的 标 ， 
' 识 符 。 程 序 员 编写 程序 时 不 能 定义 与 保留 字 相 同 的 标识 符 。 每 种 程序 设计 语言 都 ， 
! 有 一 套 保留 字 ， 保 留 字 一 般 用 来 构成 程序 整体 框架 、 表 达 关 键 值 和 具有 结构 性 的 
; 复杂 语义 等 。 掌 握 一 门 编程 语言 首先 要 热 记 其 所 对 应 的 保留 宁 .。 


om/ 


Python 3 系列 可 以 采用 中 文 等 非 英语 语言 字符 对 变量 命名 。 由 于 存在 输入 法 切 
换 、 平 台 编码 支持 、 跨 平台 兼容 等 问题 ， 从 编程 习惯 和 兼容 性 角度 考虑 ， 一 般 不 建 
议 采 用 中 文 等 非 英 语 语言 字符 对 变量 命名 。 本 书 所 有 程序 的 变量 命名 都 采用 类 文字 
符 ， 由 于 注释 内 容 不 被 解释 器 执行 ， 本 书 注释 内 容 采 用 中 文 描述 。 


表 2.1 Python 3 的 33 个 保留 字 列 表 


False | || raise 


None retum 
True NE EE ty 
and else is | while 
as except with 

assert | fnaly | nonlocal | yield 

break or | 

class from or 

continue pass 
2.2.4 字符 串 


存储 和 处 理 文 本 信息 在 计算 机 应 用 中 十 分 常见 ,文本 在 程序 中 用 字符 串 (string) 
类 型 来 表示 。Python 语言 中 ， 字 符 串 是 用 两 个 双 引 号 " "或 者 单 引 号 ' ' 括 起 来 的 一 个 
或 多 个 字符 。 实 例 代码 1.1 中 第 2、3、5、6、8、10 行 代码 都 包含 字符 串 。 

字符 串 是 字符 的 序列 ， 可 以 按照 单个 字符 或 字符 片段 进行 索引 。 字 符 串 包括 两 
种 序号 体系 : 正 向 递增 序号 和 反 向 递减 序号 ， 如 图 2.2 所 示 。 如 果 字 符 串 长 度 为 工 ， 
正 向 递增 以 最 左 侧 字符 序号 为 0， 向 右 依次 递增 ， 最 右 侧 字符 序号 为 直 -1; 反 向 递减 
序号 以 最 右 侧 字符 序号 为 -1， 向 左 依次 递减 ， 最 左 侧 字符 序号 为 -L。 这 两 种 索引 字 
符 的 方法 可 以 同时 使 用 。 实 例 代码 1.1 中 第 3 行 TempStr[-1] 表 示 字 符 串 TempStr 变 
量 的 最 后 一 个 字符 。 

反 向 递减 序号 
= 一 10. 一 8 二 省 =$ #4 =3-2 3 


1 2 3 年 -608 .9 2 
正 向 递增 序号 


图 2.2 Python 字符 串 的 两 种 序号 体系 


Python 字符 串 也 提供 区 间 访 问 方 式 ， 采 用 [N: MI 格式 ， 表 示 字 符 串 中 从 N 到 MM 
(不 包含 M) 的 子 字符 串 ， 其 中 ，N 和 M 为 字符 串 的 索引 序号 ， 可 以 混合 使 用 正 向 
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递增 序号 和 反 向 递减 序号 。 实 例 代 码 1.1 中 第 4、7 行 的 TempStr[0:-1] 表 示 字 符 串 

TempStr 变量 第 0 个 字符 开始 到 最 后 一 个 字符 “〈 但 不 包含 最 后 一 个 字符 ) 的 子 串 。 
Python 语言 有 丰富 的 字符 串 处 理 方法 ，3.5 节 将 详细 介绍 。 这 里 ， 以 温度 转换 

实例 中 的 语句 为 例 , 假如 用 户 输 入 的 字符 串 是 "110C", 相应 的 字符 串 操 作 结果 如 下 : 


2.2.5 ”赋值 语句 


程序 中 产生 或 计算 新 数据 值 的 代码 称 为 表达 式 ， 类 似 数学 中 的 计算 公式 。 表 达 
式 以 表达 单一 功能 为 目的 ， 运 算 后 产生 运算 结果 ， 运 算 结果 的 类 型 由 操作 符 或 运算 
符 决定 ， 如 实例 代码 1.1 中 第 2、4、7 等 行 都 包含 表达 式 。 

Python 诸 言 中 ,“=” 表 示 “ 赋 值 ?， 即 将 等 号 右 侧 的 计算 结果 赋 给 左 侧 变量 ， 
包含 等 号 (=) 的 语句 称 为 赋值 语句 。 实 例 代码 1.1 第 2 行 表示 将 等 号 右 侧 input() 
函数 的 结果 赋值 给 左 侧 变量 TempStr。 

此 外 ， 还 有 一 种 同步 赋值 语句 ， 可 以 同时 给 多 个 变量 赋值 ， 基 本 格式 如 下 : 

< 变量 1>，…， “< 变量 N> = < 表达 式 1>,…，< 表 达 式 N> 

同步 赋值 并 非 等 同 于 简单 地 将 多 个 单一 赋值 语句 进行 组 合 ， 因 为 ，Python 在 处 
理 同 步 赋值 时 首先 运算 右 侧 的 X 个 表达 式 , 同时 将 表达 式 的 结果 赋值 给 左 侧 YX 个 变 
量 。 例 如 ， 互 换 变 量 x 和 ?的 值 ， 如 果 采 用 单一 语句 ， 需 要 一 个 额外 变量 辅助 ， 代 
人 码 如 下 : 


PE 


同步 赋值 语句 可 以 使 赋值 过 程 变 得 更 简洁 , 通过 减少 变量 使 用 , 简化 语句 表达 ， 
增加 程序 的 可 读 性 。 但 是 ， 应 尽量 避免 将 多 个 无 关 的 单一 赋值 语句 组 合成 同步 赋值 
语句 ， 和 否则 会 降低 程序 可 读 性 。 那 么 ， 如 何 判断 多 个 单一 赋值 语句 是 否 相 关 呢 ?一 
般 来 说 ， 如 果 多 个 单一 赋值 语句 在 功能 上 表达 了 相同 或 相关 的 含义 ， 或 者 在 程序 中 
属于 相同 的 功能 ， 都 可 以 采用 同步 赋值 语句 。 


2.2.6 inputO 函 数 


实例 代码 1.1 中 的 第 2 行使 用 了 一 个 input() 函 数 从 控制 台 获 得 用 户 输 入 ， 无 论 
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用 户 在 控制 台 输 入 什么 内 容 ， inpu0 函 数 痢 以 所 符 站 奖章 返回 结果 。 
2 TempStr = input(" 请 输入 带 有 符号 的 温度 值 : ") 


在 获得 用 户 输入 之 前 ，input0 函 数 可 以 包含 一 些 提 示 性 文字 ， 使 用 方法 如 下 : 

< 变量 > = input (< 提示 性 文字 >) 

需要 注意 ， 无 论 用 户 输入 的 是 字符 或 是 数字 ，input0 函 数 统 一 按照 字符 串 类 
型 输出 。 在 如 下 例子 中 ， 当 用 户 输入 数字 1 024.256 时 ，input0) 函 数 以 字符 串 形式 
输出 。 


2.2.7 分 支 语句 


分 支 语 句 是 控制 程序 运行 的 一 类 重要 语句 ， 它 的 作用 是 根据 判断 条 件 选 择 程序 
执行 路 径 ， 使 用 方式 如 下 : 
if < 条 件 13: 
< 语句 块 1> 
elif < 条 件 2>: 
< 语句 块 2> 


else: 
< 语句 块 N> 
其 中 ，if、elif、else 都 是 保留 字 ，else 后 面 不 增加 条 件 ， 表 示 不 满足 其 他 站 语 
句 的 所 有 其 余 情 况 。 实 例 代 码 1.1 中 第 3、6、9 行 采用 了 “if-elif-else” 类 型 的 分 支 
语句 ， 如 下 : 
3 if£f TempStr[-1] in ['F',"£"]: 
6 elif TempStr[-1] in ['C','e']: 


9 else: 


其 中 ,第 3 行 让 语句 包含 第 一 个 条 件 表 达 式 : 

TempBSstE[—1] Hn [rE *£")] 

该 表达 式 由 保留 字 in 组 成 ， 表 示 判 断 字符 串 TempStr 的 最 后 一 个 字符 
(TempStr[-1]) 是 否 在 一 个 由 下 或 者 f 组 成 的 集合 中 ， 即 TempStr[-1] 是 否 等 于 F' 或 者 
f。 如 果 相 等 ， 则 返回 True， 和 否则 返回 False。 

对 于 站 语句 来 说 ， 当 in 表达 式 返 回 True 时 ， 执 行 第 4、5 行 语句 ， 如 果 返 回 
False， 则 执行 第 6 行 的 elif 语 句 ， 判 断 下 一 个 条 件 。 第 3 行 语句 在 程序 语义 上 是 判 
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断 用 户 输入 的 温度 值 是 否 是 华氏 度 。 

同 理 ， 第 6 行 elif 语句 判断 字符 串 TempStr 的 最 后 一 个 字符 〈TempStr[-1]) 是 
否 在 一 个 由 'C 或 者 'c' 组 成 的 集合 中 ， 如 果 条 件 成 立 ， 则 继续 执行 第 7、8 行 语句 ， 否 
则 执行 第 9 行 语句 。 第 6 行 语 句 在 程序 语义 上 是 判断 用 户 输入 的 温度 值 是 否 是 摄 
氏 度 。 

第 9 行 else 语句 没有 判断 条 件 ， 表 示 当 所 有 if、elif 条 件 都 不 满足 时 所 执行 的 
语句 。 该 语句 表示 用 户 输入 的 内 容 不 符合 预定 义 的 摄氏 温度 值 或 华氏 温度 值 格式 ， 
对 于 该 程序 来 说 ， 用 户 输入 错误 。 

第 3、6 行 语句 中 用 方 括号 和 逗号 组 成 的 类 型 叫 列 素 ， 其 格式 为 : [元 素 1, 元 素 
2,…, 元 素 n]。 列 表 类 型 在 程序 设计 中 十 分 常用 ，6.2 节 将 详细 介绍 列表 类 型 的 使 用 。 
4.2 节 将 详细 介绍 有 关 分 支 的 更 多 使 用 方法 。 


2.2.8 ”eval0 〇 函数 


实例 代码 1.1 中 第 4、7 行 是 赋值 语句 ， 如 下 所 示 ， 其 实现 了 IPO 描述 中 两 个 温 
度 体系 的 具体 转换 公式 。 这 两 行 语句 中 包含 了 eval(0) 函 数 。 

4 C= (eval (TemPStr[0:-1]) - 32)/1.8 

可 F = 1.8*eval (TempStr[0:-1]) + 32 

eval(< 字 符 串 >) 函 数 是 Python 语言 中 一 个 十 分 重要 的 函数 ， 它 能 够 以 Python 表 
达 式 的 方式 解析 并 执行 字符 串 ， 并 将 返回 结果 输出 。 例 如 : 


[ES II 


简单 说 ，eval(< 字 符 串 >) 的 作用 是 将 输入 的 字符 串 转变 成 Python 语句 ， 并 执行 
该 语句 。 实 例 代码 1.1 使 用 eval0 函 数 将 用 户 的 部 分 输入 (TempSt[0:-1]》 由 字符 串 
转换 成 数字 ,假设 用 户 输入 "102C"， 经 过 eval0 函 数 处 理 ， 将 变 成 Python 内 部 可 进 
行 数学 运算 的 数值 102。 


使 用 eval() 函 数 处 理 字 符 串 需要 注意 合理 使 用 。 例 如 ， 如 果 直 接 输入 字符 串 
"hello", eval0 函 数 将 去 掉 两 个 引号 , 将 其 解释 为 一 个 变量 , 由 于 之 前 没有 定义 过 hello 
变量 ， 解 释 器 会 报错 。 当 输入 字符 串 "hello" 时 ，eval() 函 数 去 掉 外 部 双 引 号 后 ， 内 
部 还 有 一 个 引号 ， 则 'hello' 被 解释 为 字符 串 。eval0 函 数 还 有 很 多 作用 ， 请 读者 在 实 
践 中 逐步 挖掘 。 
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如 果 用 户 希 望 输入 一 个 数字 小数 或 负数 )， 并 用 程序 对 这 个 数字 进行 计算 ,可 
以 采用 eval(input(< 输 入 提示 字符 串 >)) 的 组 合 ， 例 如 : 


实例 代码 1.1 中 第 4、7 行 表 达 式 中 ,等 号 右 侧 进行 了 算术 运算 。Python 支持 +、 
-、*、/ 和 #*《〈 震 ) 5 种 基本 算术 运算 操作 。 表 达 式 右 侧 的 含义 是 将 TempStr 字符 串 
中 除 最 后 一 位 外 的 子 串 转 换 成 数字 ， 再 对 数字 进行 减法 和 除法 运算 。 
Python 语法 允许 在 表达 式 内 部 标记 之 间 增 加 空格 ， 这 些 多 余 的 空格 将 被 解释 器 
去 掉 。 下 面 这 个 语句 与 第 4 行 语句 功能 一 致 。 


4 |c= (eval (Tempstr [0:-1])- 32)/1.8 


适度 增加 空格 有 助 于 提高 代码 可 读 性 ， 但 要 注意 不 能 改变 与 缩 进 相 关 的 空格 数 
量 ， 也 不 能 在 变量 名 等 命名 中 间 增 加 空格 。 

Python 语言 的 括号 与 数学 运算 中 的 括号 一 样 ， 用 来 表示 分 组 和 优先 级 。 不 使 用 
括号 时 ， 优 先 级 按照 算术 优先 级 来 确定 ， 使 用 的 多 余 括号 将 被 编译 程序 去 掉 ， 不 影 
响 程序 正确 运行 。 下 面 语句 与 第 4 行 语句 功能 一 致 。 


4 |c= (eval ( Tempstr [(0):(-1)] ) - 32) / (1.8) 


2.2.9 ”printO 〇 函数 


实例 代码 1.1 中 第 5、8、10 行使 用 print(< 待 输出 字符 串 >) 输 出 函数 输出 字符 信 
息 ， 其 也 能 以 字符 形式 输出 变量 。 当 输出 纯 字 符 信 息 时 ， 可 以 直接 将 待 输出 内 容 传 
递 给 printO0 函 数 ， 如 第 10 行 。 当 输出 变量 值 时 ， 需 要 采用 格式 化 输出 方式 ， 通 过 
format() 方 法 将 待 输出 变量 整理 成 期 望 输出 的 格式 ， 如 第 5、8 行 。 
5 | print ("转换 后 的 温度 是 {: .2f}C" .format (C)) 


8 | print ("转换 后 的 温度 是 {: .2f}F" .format (F)) 
10 | print ("输入 格式 错误 ") 
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具体 来 说 ，print0 函 数 用 槽 格式 和 format() 方 法 将 变量 和 字符 串 结合 到 一 起 输 
出 。 例 如 第 5 行 ， 输 出 的 模板 字符 串 是 "转换 后 的 温度 是 {:.2fC"， 其 中 大 括号 表 
示 一 个 槽 位 置 ， 这 个 括号 中 的 内 容 由 字符 串 后 面 紧 跟 的 format() 方 法 中 的 参数 C 填 
充 。 大 括号 {:.2 生 中 的 内 容 表 示 变 量 C 输出 的 格式 , 具体 表示 输出 数值 取 两 位 小 数值 ， 
读者 可 以 暂时 不 用 深究 ，3.6 节 将 详细 介绍 字符 串 格式 化 输出 方法 。 用 两 个 小 例子 
感受 一 下 这 段 程序 的 魅力 吧 。 


>>>C1, C2 = 10, 10.24024 
>>>print ("转换 后 的 温度 是 {: .2f}C" .format (C1)) 


转换 后 的 温度 是 10 .00C 
>>>print ("转换 后 的 温度 是 { : .2F}C". sormat (en) 
转换 后 的 温度 是 10 .24C . : 


2.2.10 循环 语句 


循环 语句 是 控制 程序 运行 的 一 类 重要 语句 ， 与 分 支 语 句 控制 程序 执行 类 似 ， 它 
的 作用 是 根据 判断 条 件 确定 一 段 程序 是 否 再 次 执行 一 次 或 者 多 次 。 

实例 代码 1.1 不 包含 循环 语句 ,程序 执行 一 次 后 退出 。 如 果 希 望 程序 一 直 运 行 ， 
连续 接受 用 户 输入 ， 直 到 用 户 输入 的 最 后 一 个 字符 是 'N' 或 mw' 时 退出 ， 可 以 采用 循环 
语句 改造 程序 ， 如 程序 代码 1.2 所 示 。 


和 实例 代码 1.2 e1.2TempConvert.py 


酒 
= 
f 
ee | 
[He 
让 
Be 


1 #el .2TempConvert.py 

2 | TempStr = input ("请 输入 带 有 符号 的 温度 值 : ") 

3 while TempStr[-1] not in ['N','n']: 

4 if Tempstr[-1] in ['F','f']: 

5 C = (eval (TempStz[0:-1]) - 32)/1.8 

6 Print ("转换 后 的 温度 是 {: .2f}Cc" .format(C)) 
7 elif TempStr[-1] in ['C','c']: 

8 F = 1.8*eval (TemPStz [0:-1]) + 32 

9 Pzint(" 转 换 后 的 温度 是 { : .2f}F" .format (F)) 
10 else: 

而 于 print ("输入 格式 错误 ") 

12 TempStr = input ("请 输入 带 有 符号 的 温度 值 : ") 


循环 语句 有 多 种 类 型 ， 实 例 代 码 1.2 采用 了 条 件 循环 。 条 件 循环 的 基本 过 程 
如 下 : 
while (< 条 件 >): 
< 语句 块 1> 
< 语句 块 2> 
当 条 件 为 真 〈“True〉 时， 执行 语句 块 1 语句 ， 这 些 语句 通过 缩 进 表达 与 while 
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语句 的 所 属 关系 。 当 条 件 为 假 (False) 时 ， 退 出 循环 ， 执 行 循环 后 语句 块 2 语句 。 
实例 代码 1.2 第 3 行使 用 了 条 件 循环 ， 该 循环 条 件 用 于 判断 用 户 输入 的 最 后 一 
个 字符 (TempStr[-1]) 是 否 为 'N' 或 'n'。 


3 | while TempStr[-1] not in ['N','n']: 


如 果 该 字符 是 'N'" 或 者 m'， 则 条 件 语句 结果 为 False， 退出 循环 ， 进 而 结束 程序 ; 
和 否则， 条 件 语句 结果 为 True， 继 续 执行 循环 内 部 语句 。 这 行 语句 中 的 not 是 保留 字 ， 
表示 对 判断 结果 取 反 。4.4 节 将 详细 介绍 循环 语句 及 其 使 用 方法 。 


2.2.11 也 数 


实例 代码 1.1 和 实例 代码 1.2 都 是 由 一 个 序列 表达 式 组 成 ， 程 序 按照 顺序 方式 sx 23 
从 头 到 尾 执行 。 实 际 编程 中 ， 一 般 将 特定 功能 代码 编写 在 一 个 函数 里 ， 便 于 阅读 和 函数 封闭 的 温度 
A 也 使 得 程序 模块 化 更 好 。 函数 可 以 理解 为 对 一 组 表达 特定 功能 表达 式 的 封装 ， 甘 并 程序 


与 数学 函数 类 似 ， 能 够 接收 变量 并 输出 结果 。inputO、printD、eval0 都 是 Python 回 回 
解释 器 的 内 置 孙 数 ， 经 过 函数 改造 后 的 温度 转换 程序 如 实例 代码 1.3 所 示 。 


实例 代码 1.3 el,3TempConvert.py 
半 #el.3TempConvert.py 
2 def tempConvert (ValueStr): 
3 if ValueStrz[-=1] in ['F','£']: 
4 C= (eval (ValueStr[0:-1]) - 32)/1.8 
5 Print(" 转 换 后 的 温度 是 {: .2£}C" .Eormat(C) ) 
6 @lif ValueStr[t=-1] in [CGI] : 
由 | F = 1.8*eval (ValueStr[0:-1]) + 32 
8 print ("转换 后 的 温度 是 {: .2f}F" .format (F)) 
9 else: 
10 print ("输入 格式 错误 ") 
11 | TempStr = input ("请 输入 带 有 符号 的 温度 值 : ") 
中 这 tempConvert (TemPStz) 


实例 代码 1.3 第 2 行 用 def 保留 字 定 义 了 一 个 名 为 tempConvert0 的 函数 ， 它 使 
用 一 个 参数 ValueStr。tempConvert0 函 数 所 属 代码 是 第 2 行 后 与 之 有 缩 进 关系 的 代 
码 ， 即 第 3 到 第 10 行 。 在 这 些 代 码 中 ，ValueStr 变量 作为 输入 函数 的 字符 串 使 用 。 
由 def 保留 字 定义 的 函数 在 程序 中 不 被 直接 执行 , 需要 使 用 函数 名 称 调用 才能 

由 于 第 11 行 没 有 缩 进 ， 它 与 第 2 行 是 平行 关系 ， 程 序 第 1 行 到 第 10 行 不 直接 
执行 ， 而 从 第 10 行 开始 执行 ， 并 接收 用 户 输入 存 到 变量 TempStr 中 。 第 12 行 调 用 
tempConvert() 函 数 ,并 将 TempStr 当 作 参数 传递 给 函数 的 内 部 变量 ValueStr。 接 下 来 ， 
程序 根据 tempConvert() 函 数 定义 执行 函数 内 容 ， 完 成 温度 转换 功能 。 

简单 地 说 ， 程 序 代码 1.3 通过 def 语句 定义 了 tempConvert(0) 函 数 ， 并 将 原 有 功 
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程序 练习 2-1 能 封装 在 这 个 函数 中 ， 语句 调用 tempConvert() 函 数 执行 这 些 功 能 。 函 数 是 代码 编写 
E Rython ey 可 以 辅助 代码 按照 功能 划分 模块 ， 有 利于 代码 之 间 进行 语句 
回国] 块 级 别 的 复 用 。 第 5 章 将 介绍 与 函数 有 关 的 更 多 内 容 。 


思考 与 练习 
is % 
A. monthly B. monTHIy ,3monthly D. Monthly3_ 
2.5 ed 并 解 
释 这 些 保 留 字 的 基本 含义 。 
2.6 请 用 一 行 代码 编写 一 个 回声 程序 ， 将 用 户 输入 的 内 容 直 接 打印 出 来 。 
2.7 试想 一 下 ， 为 什么 a 的 命名 不 能 以 数字 开头 ? 


外 sy PRVC、 fh 从 入 ')) 
2.3 实例 2: Python 蟒蛇 绘制 


Python 英文 是 “蟒蛇 ”的 意思 ， 因 此 ,绘制 一 条 蟒蛇 十 分 有 趣 。 本 节 以 “Python 
蟒蛇 绘制 ”为 例 ， 介 绍 使 用 Python 绘制 图 形 程序 的 基本 方法 ， 并 讲解 Python 语言 
的 “模块 编程 ”思想 。 

实例 代码 2.1 是 “Python 蟒蛇 绘制 ”的 源 代 码 ， 图 2.3 是 该 程序 的 输出 效果 。 


实例 代码 2.1 e2.1DrawPython.py 


#e2 .IDrawPython.PY 

import turtle 
turtle.setup(650, 350, 200, 200) 
turtle.penup () 
turtle.fd(-250) 
turtle.pendown () 
turtle.pensize(25) 
turtle.pencolor ("purple") 
9 turtle. seth (-40) 

10 for i in range (4): 

11 turtle.circle(40, 80) 
站 训 turtle.circle(-40, 80) 
13 | turtle.circle(40, 80/2) 
14 | turtle.fd(40) 

15 | turtle.circle(16, 180) 

16 | turtle.fd(40 * 2/3) 


[ei 请 
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图 2.3 Python 蟒蛇 绘制 的 输出 效果 


实例 代码 2.1 与 实例 代码 1.1 有 两 个 显著 的 不 同 。 第 一 ， 这 个 程序 没有 使 用 显 
式 的 用 户 输入 输出 ， 即 没有 inputO 函 数 和 print0 函 数 ， 第 二 ， 这 个 程序 绝 大 多 数 代 
码 行 都 是 <a>.<b>0) 形 式 ， 代 码 行 中 没有 赋值 语句 。 

<a>.<b>0 是 Python 编程 的 一 种 典型 表达 形式 ， 它 可 以 表示 调用 一 个 对 象 (1<a> 
的 方法 <b>()， 也 可 以 表示 调用 一 个 函数 库 <a> 中 的 函数 <b>()。 

实例 代码 2.1 使 用 了 用 于 绘制 图 形 的 turtle 库 ， 并 在 第 2 行 代码 中 通过 保留 字 
import 引用 这 个 函数 库 。 


2 | import turtle 


实例 代码 2.1 的 第 3 行 到 第 16 行 调用 了 turtle 库 中 若干 函数 来 绘制 Python 蟒蛇 ， 
所 有 被 调 用 的 函数 都 使 用 了 <a>.<b>0) 形 式 。 这 种 通过 使 用 函数 库 并 利用 库 中 函数 进 
行 编程 的 方法 是 Python 语言 最 重要 的 特点 ， 称 为 “模块 编程 "。8.5 节 将 详细 介绍 
Python 模块 编程 思想 以 及 本 书 所 提出 的 面向 “计算 生态 ”的 教学 理念。 
用 网 前 面向 对 象 编程 

人 面向 对 象 编程 ( Object-Oriented Programming, OOP ) 是 一 种 基于 对 象 ( Object) ， 
| 的 编程 范式 。 对 象 是 事物 的 一 种 抽象 ， 它 是 一 个 实体 ， 包 含 属性 和 方法 两 部 分 。 ， 
; 属性 是 对 象 中 的 变量 ， 方 法 是 对 象 能 够 完成 的 操作 
;假设 对 象 是 0， 则 0.a 表示 对 象 0 的 属性 a，0O.b0 表 示 对 象 0 的 操作 b0， ， 
; 其 中 a 是 一 个 变量 值 ，b0 是 一 个 函数 。 例如， 一 辆 汽车 可 以 作为 一 个 对 象 ， 标 记 ， 
! 为 C， 汽 车 的 颜色 是 汽车 的 属性 ， 表 示 为 C.color， 前 进 是 汽车 的 一 个 动作 ， 相 当 |; 
.于 一 个 功能 ， 因 此 前 进 是 对 象 C 的 方法 ， 表 示 为 O.forward0)。 


~» 
\ 


[1] 本 书 不 讲解 面向 对 象 编程 ， 因 此 ， 读 者 只 需 了 解 与 对 象 有 关 的 基本 概念 即 可 。 
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使 用 import 引用 函数 库 有 两 种 方式 ， 但 对 函数 的 使 用 方式 略 有 不 同 。 
第 一 种 引用 函数 库 的 方法 如 下 : 

import < 库 名 > 

此 时 ， 程 序 可 以 调用 库 名 中 的 所 有 函数 ， 使 用 库 中 函数 的 格式 如 下 : 
< 库 名 > .< 函数 名 > (< 函数 参数 >) 

第 二 种 引用 函数 库 的 方法 如 下 : 

from < 库 名 > import < 函数 名 , 函数 名 ,…, 函数 名 > 

from < 库 名 > import * # 其 中 ，* 是 通配符 ， 表 示 所 有 函数 

此 时 ， 调 用 该 座 的 函数 时 不 再 需要 使 用 库 名 ， 直 接 使 用 如 下 格式 : 
< 函数 名 > (< 函数 参数 >) 

采用 第 二 种 库 引 用 方式 修改 实例 代码 2.2 完成 Python 蟒蛇 绘制 ， 代 码 如 下 : 


实例 代码 2.2 e2.2DrawPython.py 
1 ] #e2 .2DrawPython .py 

2 from turtle import * 

3 | setup(650, 350, 200, 200) 

4 | Penup() 

5 | fd(-250) 

6 | Pendown () 

了 Pensize(25) 

8 Pencolor ("purple") 


9 seth (-40) 
10 for i in range (4): 


1 工 circle(40，80) 
有 circle(-40, 80) 
13 | circle(40, 80/2) 
14 | fd(40) 

15 | circle(16, 180) 


16 | fd(40 * 2/3) 


实例 代码 2.2 与 实例 代码 2.1 运行 结果 相同 ， 所 不 同 的 是 调用 turtle 库 中 函数 时 
不 再 采用 <a>.<b>() 方 式 ， 而 直接 使 用 函数 名 。 由 于 “Python 蟒蛇 绘制 ”程序 只 用 了 
turtle 库 中 的 setup()、penup()、 fd0、pendown()、pensize()、pencolor()、seth()、circle() 
等 8 个 函数 ， 第 2 行 的 import 语句 也 可 以 写成 如 下 形式 : 


2 from turtle import setup, penup, fd, pendown 


3 | from turtle import pensize, pencolor, seth, circle 


两 种 函数 库 引 用 方式 各 有 优点 。 第 一 种 采用 <a>.<b>0 方 式 调用 库 中 函数 ， 能 够 
显 式 标明 函数 来 源 ， 在 引用 较 多 库 时 代码 可 读 性 更 好 。 第 二 种 利用 保留 字 直 接 引 用 
库 中 函数 ， 可 以 使 代码 更 简洁 ， 在 类 似 实例 代码 2.2 这 种 只 引用 一 个 库 的 情况 下 ， 
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需要 注意 的 是 ， 第 一 种 引用 方式 ，Python 解释 器 将 <a>.<b> 整 体 作为 函数 名 。 
当 采 用 第 二 种 方式 时 ，Python 解释 器 将 <b> 作 为 函数 名 。 这 可 能 产生 一 种 情况 ， 假 
设 用 户 已 经 定义 了 一 个 函数 <b>， 库 中 的 函数 名 <b> 将 会 与 用 户 自 定义 的 函数 名 神 
突 。 由 于 Python 程序 要 求 函数 命名 唯一 ， 所 以 ， 当 函数 名 冲突 时 Python 解释 器 会 
以 最 近 的 函数 定义 为 准 。 为 了 避免 可 能 的 命名 冲突 ， 对 于 初学 者 ， 建 议 采 用 第 一 种 
库 引 用 方式 ， 使 用 <a>.<b>() 方 式 调 用 库 函 数 。 


思考 与 练习 

2.8 请 修改 实例 代码 2.1 中 第 8 行 代码 , 将 "purple" 变 为 "violet", 观察 程序 运行 
结果 的 变化 。 

2.9 ”请 修改 实例 代码 2.1 中 第 10 行 代码 ， 将 range(4) 变 为 range(5)， 观 察 程 序 
云 行 结果 的 变化 。 

2.10 请 修改 实例 代码 2.1 中 第 4 行 和 第 6 行 代码 ， 在 两 行 的 最 前 面 增加 注释 
符号 ， 即 将 这 两 行 变 成 注释 语句 ， 观 察 程序 运行 结果 的 变化 。 


2.4 turtle 库 语 法 元 素 分 析 


要 可 四 结合 “Python 蟒蛇 绘制 ” 实例， 分析 turtle 库 语法 元 素 ， 包 括 绘图 ， 
坐标 体系 、 画 笔 控 制 函数 和 形状 绘制 函数 等 。 


Python 的 turtle 库 是 一 个 直观 有 趣 的 图 形 绘 制 函数 库 。turtle (海龟 ) 图 形 绘制 
的 概念 诞生 于 1969 年 , 并 成 功 应 用 于 LOGO 编程 语言 。 由 于 turtle 图 形 绘制 概念 十 
分 直观 且 非 常 流行 ，Python 接受 了 这 个 概念 ， 形 成 了 一 个 Python 的 turtle 库 ， 并 成 
为 标准 库 之 一 。9.4 节 将 全 面 介绍 turtle 库 的 使 用 , 本 书 末 尾 将 给 出 完整 的 快速 参考 。 
为 了 介绍 Python 模块 编程 思想 并 解释 “Python 蟒蛇 绘制 ”程序 ， 本 节 结 合 实例 代码 
2.1 介绍 turtle 库 中 部 分 函数 的 使 用 ， 这 些 函 数 将 同时 用 于 后 续 章 节 的 部 分 实例 中 。 


I 
' 
1 
起 


2.4.1 绘图 坐标 体系 


turtle 库 绘 制图 形 有 一 个 基本 框架 : 一 个 小 海鱼 在 坐标 系 中 扑 行 ,其 息 行 轨迹 形 
成 了 绘制 图 形 。 对 于 小 海龟 来 说 ， 有 “前 进 ”“ 后 退 ” “旋转 ”等 和 仆 行 行为 ， 对 坐 
标 系 的 探索 也 通过 “前 进 方向 ”“ 后 退 方向 ”“ 左 侧 方 向 ”和 “ 右 侧 方向 ”等 小 海 
怨 自 身 角度 方位 来 完成 。 刚 开始 绘制 时 ,小 海龟 位 于 画布 正中 央 ， 此 处 坐标 为 (0, 0)， 
行进 方向 为 水 平 右 方 。 例 如 ， 用 如 下 代码 绘制 如 图 2.4 所 示 的 图 坐标 体系 。 


3 turtle.setup(650, 350, 200, 200) 
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图 2.4 Python turtle 库 绘 图 坐标 体系 


实例 代码 2.1 第 3 行使 用 了 turtle.setup0) 函 数 ， 该 函数 各 参数 的 关系 如 图 2.5 所 
示 ， 其 具体 定义 如 下 。 


turtle. se 大 uP (width, height, startx, starty) 


图 2.5 turtle.setup0) 函 数 4 个 参数 的 含义 


作用 : 设置 主 窗 体 的 大 小 和 位 置 。 
参数 如 下 。 
width: 窗口 宽度 ， 如 果 值 是 整数 ， 表 示 像 素 值 ， 如 果 值 是 小 数 ， 表 示 窗 口 宽度 
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与 屏幕 的 比例 。 
height， 窗口 高 度 ， 如 果 值 是 整数 ， 表 示 像素 值 ， 如 果 值 是 小 数 ， 表 示 窗 口 高 
度 与 屏幕 的 比例 。 
startx: 窗口 左 侧 与 屏幕 左 侧 的 像素 距离 ， 如 果 值 是 None， 窗 口 位 于 屏幕 水 平 
中 央 。 
starty 窗口 顶部 与 屏幕 项 部 的 像素 距离 ， 如 果 值 是 None， 窗 口 位 于 屏幕 垂直 
中 央 。 


2.42 画笔 控制 函数 


1. turtle.penup() 和 turtle.pendown() 函 数 


4 turtle.penup() 
6 turtle.pendown () (实例 代码 2.1 中 第 4、6 行 ) 


turtle 中 的 画笔 〈 即 小 海龟 ) 可 以 通过 一 组 函数 来 控制 ， 实 例 代码 2.1 中 第 4 行 
的 turtle.penup0) 函 数 和 第 6 行 的 turtle.pendown(0 函 数 是 一 组 ， 它 们 分 别 表示 抬 起 画 
笔 和 落下 画笔 ， 函 数 定义 如 下 : 

turtle.penup () 

别名 

turtle.pu(), turtle.up() 


作用 : 抬 起 画笔 ， 之 后 移动 画笔 不 绘制 形状 。 


参 数 : 无 o 
turtle .Pendown () 
别名 


turtle.pd(), turtle.down() 

作用 : 落下 画笔 ， 之 后 移动 画笔 将 绘制 形状 。 
参数 : 无 。 

2. turtle.pensize(O) 函 数 


而 turtle .Pensize(25) (实例 代码 2.1 中 第 7 行 》 


turtle.pensize() 函 数 用 来 设置 画笔 尺寸 ， 函 数 定义 如 下 : 

turtle.pensize (width) 

别名 

turtle.width() 

作用 : 设置 画笔 宽度 ， 当 无 参数 输入 时 返回 当前 画笔 宽度 。 

参数 如 下 。 

width: 设置 的 画笔 线条 宽度 ， 如 果 为 None 或 者 为 空 ， 则 函数 返回 当前 画笔 宽度 。 
3.，turtle.pencolor() 函 数 


8 turtle.pencolor ("purple") (实例 代码 2.1 中 第 8 行 ) 
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turtle.pencolor() 函 数 给 画笔 设置 颜色 ， 实 例 代 码 2.1 中 将 画笔 设 为 “紫色 ”， 函 


数 定义 如 下 : 


turtle.pencolor (colorstring) 


或 


turtle.pencolor((r,g,b)) 


作用 : 设置 画笔 颜色 ， 当 无 参数 输入 时 返回 当前 画笔 颜色 。 


参数 如 下 。 


colorstring : 表示 颜色 的 字符 串 ， 例 如 ，"purple"、"red"、"blue" 等 。 
(zygrb) : 颜色 对 应 的 RGB 数值 ， 例 如 ，(51， 204，140) 。 


很 多 RGB 颜色 都 有 固定 的 英文 名 字 , 这 些 英文 名 字 可 以 作为 colorstring 输入 到 
turtle.pencolor0) 函 数 中 ， 也 可 以 采用 (r, g, b) 形 式 直 接 输 入 颜色 值 。 几 种 典型 的 RGB 


颜色 如 表 2.2 所 示 。 
表 2.2 部 分 典型 RGB 颜色 对 照 表 
英文 名 称 中 文 名 称 
white 白色 
black | 000 | #000000 | 黑色 
grey 灰色 
darkgreen 深 绿色 
gold 金色 
violet 紫罗兰 
purple 紫色 
拓展 : ”RGB 颜色 


-~ 


RGB 颜色 是 计算 机 系统 最 常用 的 颜色 体系 之 一 , 它 采 用 R( 红色 )、G( 绿色 )、 
'B( 蓝 色 ) 3 种 基本 颜色 及 它们 的 登 加 组 成 各 式 各 样 的 颜色 ， 构 成 颜色 体系 。RGB 
' 颜色 诞生 于 19 世纪 中 期 、 计 算 机 产生 之 前 ， 理 论 表 明 ，RGB 颜色 能 够 形成 人 眼 


' 感知 的 所 有 颜色 。 


具体 来 说 ，RGB 颜色 采用 (1, g,b) 表示 ， 其中， 每 个 颜色 采用 8 bit 表示 ， 
! 取 值 范围 是 [0, 255]。 因 此 ，RGB 颜色 一 共 可 以 表示 2562 (16 M; 约 1 678 万 ) 


1. turtle.fd() 函 数 


5 turtle.fd(-250) 
14 | turtle.fd(40) 
16 | turtle.fd(40 * 2/3) 


(实例 代码 2.1 中 第 5、14、16 行 ) 
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turtle 通过 一 组 函数 控制 画笔 的 行进 动作 ， 进 而 绘制 形状 。turtle.fd0 函 数 最 常用 
来 控制 画笔 向 当前 行进 方向 前 进 一 个 距离 ， 函 数 定义 如 下 : 
turtle.fd(distance) 


别名 


turtle.forward (distance) 

作用 : 向 小 海龟 当前 行进 方向 前 进 distance 距离 。 

参数 如 下 。 

distance: 行进 距离 的 像素 值 ， 当 值 为 负数 时 ， 表 示 向 相反 方向 前 进 。 


实例 代码 2.1 中 第 5、14、16 行 分 别 表示 向 画笔 当前 前 进 方向 或 反方 向 行进 一 
段 距离 ， 进 而 绘制 一 条 直线 。 第 $ 行 代码 由 于 配合 了 第 4 行 抬 起 画笔 函数 ， 因 此 ， 
它 将 不 绘制 一 条 直线 ， 而 是 将 画笔 移动 到 某 个 位 置 。 

2.，turtle.seth() 函 数 


9 turtle.seth(-40) 


turtle.seth() 函 数 用 来 改变 画笔 绘制 方向 ， 函 数 定义 如 下 : 

turtle.seth (to angle) 

别名 

turtle.setheading (to angle) 

作用 : 设置 小 海龟 当前 行进 方向 为 to_angle， 该 角度 是 绝对 方向 角度 值 。 
参数 如 下 。 


to_angle: 角度 的 整数 值 。 
如 图 2.6 所 示 是 turtle 库 的 角度 坐标 体系 ， 供 turtle.seth(0) 等 函数 使 用 。 需 要 注意 


一 — 
一 一 一 一 
< PE x 


90 / -270 度 


(0, 0) 


270 / -90 度 


图 2.6 turtle 库 的 角度 坐标 体系 
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的 是 ，turtle 库 的 角度 坐标 体系 以 正 东 向 为 绝对 0 度 ， 这 也 是 小 海龟 初始 疏 行 方向 ， 
正 西向 为 绝对 180 度 ， 这 个 方向 坐标 体系 是 方向 的 绝对 方向 体系 ， 与 小 海 包 息 向 当 
前 方向 无 关 。 因 此 ， 可 以 利用 这 个 绝对 坐标 体系 随时 更 改 小 海龟 的 前 进 方向 。 
实例 代码 2.1 中 第 9 行将 小 海龟 的 前 进 方向 设 定 为 -40 度 , 即 320 度 , 之 后 小 海 
龟 向 这 个 方向 前 进 。 
3.， for 循环 语句 和 turtle.circle() 函 数 


10 for i in range (4): 

于 turtle.circle(40, 80) 

12 turtle.circle(-40, 80) (实例 代码 2.1 中 第 10 一 15 行 ) 
13 turtle.circle(40, 80/2) 


13 turtle.circle(16, 180) 


由 于 存在 缩 进 ， 实 例 代码 2.1 中 第 10、11、12 行 是 一 个 由 保留 字 for 引导 的 整 
体 ， 这 是 另 一 种 循环 结构 ， 称 为 “遍历 循环 ”。for 语句 的 循环 格式 如 下 : 

for i in range (< 循环 次 数 >) : 

< 语句 块 1> 

这 里 请 读者 记 住 这 种 结构 ，4.4 节 将 深入 介绍 这 种 循环 结构 的 使 用 。 实 例 代码 
2.1 中 第 10 行 的 for 循环 表示 第 11、12 行 代码 连续 执行 4 次 。 

turtle.circle() 函 数 用 来 绘制 一 个 弧 形 ， 函 数 定义 如 下 参数 含义 如 图 2.7 所 示 ): 

turtle.circle (radius, extent=None) 

作用 : 根据 半径 radius 绘制 extent 角度 的 弧 形 ， 绘 制 模 式 如 图 2.7 所 示 。 


| =) WN x 


初始 位 置 
圆心 


radius 


图 2.7 turtle.cirele() 函 数 的 参数 含义 


参数 如 下 。 

raduis: 弧 形 半径 ， 当 值 为 正 数 时 ， 半 径 在 小 海龟 左 侧 ， 当 值 为 负数 时 ， 半 径 在 
小 海龟 右 侧 。 

extent: 绘制 弧 形 的 角度 ， 当 不 设置 参数 或 参数 设置 为 None 时 , 绘制 整个 圆 形 。 

实例 代码 2.1 中 各 函数 包括 角度 值 、 半 径 值 等 参数 是 根据 绘制 内 容 的 样式 调整 
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确定 的 ， 在 了 解 各 函数 使 用 含义 的 基础 上 ， 读 者 可 以 修改 各 函数 参数 值 ， 观 察 蟒蛇 
绘制 的 效果 。 


2.44 函数 的 封装 


实例 代码 2.1 的 程序 功能 可 以 分 成 两 类 : 绘制 图 形 前 对 画笔 的 设置 ,包括 颜色 、 3 
尺寸 、 初 始 位 置 等 ， 以 及 绘制 Python 蟒蛇 的 功能 。 由 于 蟒蛇 绘制 的 功能 相对 独立 ， 封装 的 python 里 
可 以 用 函数 来 封装 ， 实 例 代 码 2.3 给 出 了 带 有 函数 定义 的 程序 。 其 中 ， 第 3 一 11 行 : 序 : 
通过 保留 字 def 定义 了 drawSnake0 函 数 ， 将 蟒蛇 绘制 这 个 独立 功能 封装 起 来 。 


实例 代码 2.3 e2.3DrawPython.py 

1 #e2.3DrawPython.py 

2 import turtle 

3 def drawSnake (radius, angle, length): 
4 tuztle .seth(-40) 

5 for i in range (length): 

6 turtle.circle(radius, angle) 
7 turtle.circle(-radius, angle) 
8 turtle.circle(radius, angle/2) 

9 turtle. fd (40) 

10 turtle.circle(16, 180) 

加 turtle.fd(40* 2/3) 

过 turtle.setup(650, 350, 200, 200) 

13 | turtle.penup() 

14 turtle.fd(-250) 

15 | turtle.pendown () 

16 turtle.pensize(25) 

17 | turtle.pencolor ("purple") 

18 drawSnake (40, 80, 4) 

19 turtle.done () 

通过 保留 字 def 定义 的 函数 是 自 定义 函数 。 自 定义 函数 与 turtle 库 提 供 的 函数 不 Or 


同 ， 它 们 是 用 户 自己 定义 实现 的 。 第 5 音 将 详细 介绍 有 关 函 数 的 功能 和 使 用 。 a 


思考 与 练习 
2.11 请 使 用 turtle 库 的 turtle.fd0 函 数 绘制 一 条 直线 。 
2.12 请 使 用 turtle 库 中 turtle.circle0) 函 数 绘制 一 个 完整 的 圆 。 
2.13 请 使 用 turtle 库 函数 绘制 一 个 包含 9 个 同心 圆 的 靶 盘 。 
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本 章 从 解决 实际 问题 入 手 ， 以 简单 的 温度 转换 程序 为 例 ， 逐 行 逐 句 地 分 析 了 
Python 语言 的 基本 元 素 。 通 过 讲解 Python 蟒蛇 绘制 实例 ， 介 绍 Python 语言 函数 库 
turtle 及 其 基本 用 法 。 


程序 练习 题 


2.1 实例 1 的 修改 。 改 造 实例 代码 1.1， 采 用 eval(input(< 提 示 内 容 >)) 替 换 现 有 


2.2 汇率 兑换 程序 。 按 照 温 度 转换 程序 的 设计 思路 ， 按 照 1 美元 =6 人 民 币 汇 
率 编写 一 个 美元 和 人 民 币 的 双向 兑换 程序 。 

2.3 实例 2 的 修改 。 改 造 实例 代码 2.1， 绘 制 一 条 彩色 蟒蛇 ， 即 在 绘制 Python 
蟒蛇 的 每 个 小 段 时 ， 画 笔 的 绘制 颜色 会 发 生变 化 。 

提示 : 将 画笔 颜色 控制 函数 放 到 蟒蛇 绘制 函数 附近 。 

2.4 等 边 三 角形 的 绘制 。 使 用 turtle 库 中 的 turtle.fd0 函 数 和 turtle.sethO 函 数 绘 
制 一 个 等 边 三 角形 ， 效 果 如 图 2.8 所 示 。 

2.5 ”车 加 等 边 三 角形 的 绘制 。 使 用 turtle 库 中 的 turtle.fd0) 函 数 和 turtle.seth0 函 
数 绘制 一 个 又 加 等 边 三 角形 ， 效 果 如 图 2.9 所 示 。 


图 2.8 ”等 边 三 角形 的 绘制 效果 图 2.9 芝 加 等 边 三 角形 的 绘制 效果 


2.6 无 角 正 方形 的 绘制 。 利 用 turtle 库 函 数 绘 制 一 个 没有 角 的 正方 形 ， 效 果 如 
图 2.10 所 示 。 
2.7 六 角形 的 绘制 。 利 用 turtle 库 绘制 一 个 六 和 角形， 效果 如 图 2.11 所 示 。 
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图 2.10 无 角 正 方形 的 绘制 效果 图 2.11 六角 形 的 绘制 效果 


2.8 正方形 螺旋 线 的 绘制 。 利 用 turtle 库 绘 制 一 个 正方 形 螺旋 线 , 效果 如 图 2.12 
所 示 。 


图 2.12 正方 形 螺旋 线 的 绘制 效果 


2.9 自 定 义 Python 蟒蛇 绘制 。 根 据 实例 2 的 设计 思想 ， 结 合 读者 喜好 ， 绘 制 
一 条 区 别 于 实例 2 的 Python 蟒蛇 。 
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第 二 部 分 深入 Python 证 站 


本 部 分 主要 讲解 Python 语言 的 基本 语法 ， 建 立 对 Python 语言 常用 语法 体系 的 
基本 理解 ,使 读者 掌握 利用 Python 语言 编写 程序 的 能 力 ， 初 步 掌 握 利 用 程序 解决 计 
算 问 题 的 方法 。 本 部 分 的 学 习 目 标 是 编写 20 行 左右 的 Python 程序 。 

本 部 分 包括 5 章 内 容 (第 3~7 章 )， 分别 如 下 : 

第 3 章 基本 数据 类 型 

第 4 章 程序 的 控制 结构 

第 5 章 函数 和 代码 复 用 

第 6 章 组 合 数据 类 型 

第 7 章 文件 和 数据 格式 化 

第 3 章 主要 讲解 Python 语言 的 基本 数据 类 型 ， 包 括 整 数 、 浮 点 类 、 复 数 、 字 符 
串 等 类 型 的 概念 和 使 用 ， 同 时 ， 介 绍 标准 库 math 的 使 用 。 

第 4 章 主要 讲解 Python 语言 的 指令 流 控制 结构 ， 包 括 顺序 结构 、 分 支 结 构 、 循 
环 结构 、 蜡 常 处 理 结构 等 ， 同时， 介绍 标准 库 random 的 使 用 。 

第 5 章 主 要 讲解 函数 的 概念 ， 包 括 函 数 的 基本 使 用 、 函 数 的 参数 传递 、 代 码 复 
用 、 基 于 函数 的 模块 化 设计 、 递 归 等 ， 同 时 ， 介 绍 标准 库 datetime 的 使 用 。 

第 6 章 主要 讲解 Python 语言 的 组 合 数据 类 型 ， 包 括 元 组 、 集 合 、 列 表 、 字 典 等 
类 型 的 概念 和 使 用 ， 同 时 ， 介 绍 第 三 方 中 文 分 词 库 jieba 的 使 用 。 

第 7 章 主要 讲解 文件 和 数据 格式 化 ， 包 括 文 件 的 使 用 以 及 一 二 维和 高 维 数据 组 
织 和 格式 化 方法 ， 介 绍 第 三 方 图 像 处 理 库 PIL 和 标准 库 JSON 的 使 用 。 

本 部 分 按照 数据 表示 、 程 序 结构 和 抽象 交互 3 个 层次 依次 讲解 Python 语言 语法 ， 
其 中 ， 数 据 表 示 对 应 第 3 章 和 第 6 章 ; 程序 结构 对 应 第 4 章 ; 抽象 交互 对 应 第 5 章 
和 第 7 章 。 建议 读者 按照 章节 顺序 阅读 和 学 习 本 部 分 内 容 . 


| 


| 
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为 让 雇 形 颖 柏 阵 刘 : 一 参 在 络 储 痪 委 扩 ， 一 参 契 交 人 朱 友 hy 
There are only two kinds of programming languages: those people always bitch 
about and those nobody uses. 
一 一 本 杭 尼 ，。 斯 特 劳 斯 特 卢 普 〈Bjarne Stroustrup ) 
C++ 语言 之 父 


(1) 掌握 3 种 数字 类 型 的 概念 和 使 用 。 

(2) 了 解 3 种 数字 类 型 在 计算 机 中 的 表示 方法 。 
(3) 运用 Python 的 标准 数学 库 进行 数值 计算 。 
(4) 掌握 字符 串 类 型 的 概念 和 使 用 。 

! “(5) 掌握 字符 串 类 型 的 格式 化 操作 方法 和 应 用 。 


mm 
NA 
二 二 


1951 年 ， 毛 泽 东 主席 题词 “好 好 学 习 、 天 天 向 上 ”， 成 为 激励 一 代 代 中 国人 奋 
发 图 强 的 经 典 短语 。 可 是 在 实际 操作 中 难免 会 让 人 疑惑 ,“ 好 好 学 习 ” 究 竟 能 好 到 什 
么 程度 ? “天 天 向 上 ”难道 要 全 年 365 天 完全 无 休 ? 本 章 将 采用 编程 思想 ， 充 分 考 
虑 实际 努力 因素 和 时 间 累 积 程度 ， 使 用 Python 来 演算 天 天 向 上 的 力量 。 
“好 好 学 习 、 天 天 向 上 ” 它 的 力量 十 分 惊人 ! 
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v= 


3.1.1 数字 类 型 概述 


数字 是 自然 界 计数 活动 的 抽象 ， 更 是 数学 运算 和 推理 表示 的 基础 。 计 算 机 对 数 
字 的 识别 和 处 理 有 两 个 基本 要 求 : 确定 性 和 高 效 性 。 

确定 性 指 程序 能 够 正确 且 无 歧义 地 解读 数据 所 代表 的 类 型 含义 。 例 如 ， 输 入 
1010,， 计算 机 需要 明确 地 知道 这 个 输入 是 可 以 用 来 进行 数学 计算 的 数字 1010, 还 是 
类 似 房间 门牌 号 一 样 的 字符 串 "1010"， 这 两 者 用 处 不 同 、 操 作 不 同 且 在 计算 机 内 部 
存储 方式 不 同 。 即 便 1010 是 数字 ， 还 需要 进一步 明确 这 个 数字 是 十 进 制 、 二 进 制 还 
是 其 他 进 制 类 型 。 

高 效 性 指 程序 能 够 为 数字 运算 提供 较 高 的 计算 速度 ， 辣 有 和 和 人 人 
代价 。 整 数 和 带 有 小 数 的 数字 分 别 由 计算 机 中 央 处 理 器 司 的 硬件 过 加 
于 相同 类 型 操作 ， 如 整数 加 法 和 小 数 加 法 ， 前 者 比 后 者 的 速度 一 般 快 5~20 倍 、 为 
了 尽 可 能 提高 运行 速度 ， 需 要 区 分 不 同 运行 速度 的 不 同 数字 类 型 。 

表示 数字 或 数值 的 数据 类 型 称 为 数字 类 型 ，Python 语言 提供 3 种 数字 类 型 : 整 
数 ` 浮 点 数 和 复数 , 分 别 对 应 数学 中 的 整数 实数 和 复数 。 1010 表示 一 个 整数 , "1010" 
表示 一 个 字符 串 。 


3.1.2 ”整数 类 型 


整数 类 型 与 数学 中 整数 的 概念 一 致 ， 下 面 是 整数 类 型 的 例子 

1010, 99, -217, Ox9a, -0x89 

整数 类 型 共有 4 种 进 制 表示 : 和 十进制、 二进制、 八进制 和 十 六 进 制 。 默认 情况 ， 
整数 采用 十 进 制 , 其 他 进 制 需要 增加 引导 符号 , 如 表 3.1 所 示 。 二 进 制 数 以 0b 引导 ， 
八进制 数 以 0o 引导 ， 十 六 进 制 数 以 0x 引导 ， 大 小 写字 母 均 可 使 用 。 


表 3,1 整数 类 型 的 4 种 进 制 表示 


进 制 种 类 描述 
十 进 制 默认 情况 ， 例 如 ，1010,-425 
二 进 制 由 字符 0 和 1 组 成 ， 例 如 ，0b101，0B101 
八进制 由 字符 0 到 7 组 成 ， 例 如 ，0o711，00711 


十 六 进 制 由 字符 0 到 9、a 到 f、A 到 F 组 成 ， 例 如 ，0xABC 
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整数 类 型 理论 上 的 取 值 范围 是 [- w ,co ]， 实 际 上 的 取 值 范围 受 限 于 运行 Python 
程序 的 计算 机 内 存 大 小 。 除 极 大 数 的 运算 外 , 一 般 认 为 整数 类 型 没有 取 值 范围 限制 。 
pow(x.y) 函 数 是 Python 语言 的 一 个 内 置 函 数 趾 ， 用 来 计算 x*。 这 里 ， 用 pow0 
函数 测试 一 下 整数 类 型 的 取 值 范 围 ， 例 如 : 


pow0 函 数 还 可 以 髓 套 


使 用 ， 例 如 : 


上 述 程序 可 以 在 一 般 计算 机 上 运行 并 输出 运算 结果 , pow(2,pow(2,15)) 的 结果 是 
一 个 9 865 位 的 整数 。 增 加 程序 中 第 二 个 powO 函 数 的 震 会 获得 更 大 的 输出 结果 ， 例 
如 ， 将 数值 15 改 为 16， 这 会 消耗 更 长 的 计算 时 间 并 占用 更 多 的 计算 机 内 存 。 


3.1.3 浮 点 数 类 型 


浮 点 数 类 型 与 数学 中 实数 的 概念 一 致 ， 表 示 带 有 小 数 的 数值 。Python 语言 要 求 
所 有 浮 点 数 必须 带 有 小 数 部 分 ， 小 数 部 分 可 以 是 0， 这 种 设计 可 以 区 分 浮 点 数 和 整 
数 类 型 。 浮 点 数 有 两 种 表示 方法 : 十 进 制 表示 和 科学 计数 法 表示 。 下 面 是 浮 点 数 类 
型 的 例子 : 

Qa0: 二 有 人 6 一 3 ES5 

科学 计数 法 使 用 字母 e 或 E 作为 寡 的 符号 ， 以 10 为 基数 ， 含 义 如 下 : 

<a>e<b> = a*10? 

上 例 中 4.3e-3 值 为 0.004.3; 9.6E5 也 可 以 表示 为 9.6E+5， 其 值 为 960 000.0。 

浮 点 数 类 型 与 整数 类 型 由 计算 机 的 不 同 硬件 单元 执行 ， 处 理 方法 不 同 ， 需 要 注 
意 的 是 ， 尽 管 浮 点 数 0.0 与 整数 0 值 相同 ， 但 它们 在 计算 机 内 部 表示 不 同 。 

Python 浮 点 数 的 数值 范围 和 小 数 精度 受 不 同 计 算 机 系统 的 限制 ，sys.float_info 
详细 列 出 了 Python 解释 器 所 运行 系统 的 浮 点 数 各 项 参数 ， 例 如 : 


[1] 内 团 函 数 指 Python 语言 解释 器 包含 的 函数 , 这 些 函 数 可 以 直接 使 用 。5.8 节 给 出 了 Python 
语言 完整 的 内 置 函数 列表 。 
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上 述 输出 给 出 浮 点 数 类 型 所 能 表示 的 最 大 值 (max)、 最 小 值 (min)， 科 学 计数 
法 表示 下 最 大 值 的 守 (max_10_exp)、 最 小 值 的 寡 (min_10_exp)， 基 数 (radix) 为 
2 时 最 大 值 的 寡 (max_exp)、 最 小 值 的 究 Cmin_exp)， 科 学 计数 法 表示 中 系数 (<a>) 
的 最 大 精度 Cmant dig)， 计 算 机 所 能 分 辩 的 两 个 相 邻 浮 点 数 的 最 小 差 值 Cepsilon )， 
能 准确 计算 的 浮 点 数 最 大 个 数 (dig)。 

浮 点 数 类 型 直接 表示 或 科学 计数 法 表示 中 的 系数 (<a>) 最 长 可 输出 16 个 数字 ， 
浮 点 数 运算 结果 中 最 长 可 输出 17 个 数字 , 然而 , 根据 sys.float_info 结果 ,计算 机 只 
能 够 提供 15 个 数字 (dig) 的 准确 性 ， 最 后 一 位 由 计算 机 根据 二 进 制 计 算 结 果 确 定 ， 
存在 误差 ， 例 如 : 


浮 点 数 在 超过 15 位 数字 计算 中 产生 的 误差 与 计算 机 内 部 采用 二 进 制 运算 有 关 ， 
使 用 herp 的 数学 运算 。 
由 于 Pythen 语 i 


数 计算 ， 因此 ， ea 


法 值 ， 它 们 的 长 度 只 \ 有 10 个 ， 其 中 : 


a=3.141592653, b=1.234567898 
可 以 直接 采用 浮 点 数 运算 ， 也 可 以 同时 把 它们 的 小 数 点 去 掉 ， 当 作 整 数 运算 ， 
结果 如 下 : 


其 中 ， 浮 点 数 运算 输出 17 个 数字 长 度 的 结果 ， 然 而 ， 只 有 前 15 个 数字 是 确定 
正确 的 。 整 数 运算 能 够 输出 完全 准确 的 运算 结果 。 使 用 整数 表达 浮 点 数 的 方法 是 高 
精确 度 运算 的 基本 方法 之 一 。 
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简单 地 说 ， 浮 点 数 类 型 的 取 值 范围 在 [2 ,21 9], 即 [-2.225x10™, a 
之 间 ， 运 算 精 度 为 2.220x10”“， 即 浮 点 数 运算 误差 仅 为 0.000 000 000 000 000 2。 对 
于 高 精度 科学 计算 外 的 绝 大 部 分 运算 来 说 , 浮 点 数 类 型 足够 “可 靠 ”, 一 般 认为 浮 点 
数 类 型 没有 范围 限制 ， 运 算 结 果 准 确 。 


3.1.4 复数 类 型 


复数 类 型 表示 数学 中 的 复数 。 很 久 以 前 ， 数 学 界 被 求解 如 下 等 式 难 住 了 : 
| 
这 是 因为 任何 实数 都 不 是 上 述 等 式 的 解 。 直到 18 世纪 , 数学 家 发 明了 “虚数 单 
位 ”， 记 为 j， 并 规定 =V-1。 围 绕 这 个 特殊 数字 出 现 了 新 的 数学 分 支 ， 产 生 了 “ 复 
数 ”。 对 于 一 个 实数 n， 根 据 上 述 定义 ，nxjxij 的 值 是 -s， 图 3.1 给 出 了 对 虚数 单位 j 
的 表示 ， 如 果 将 实数 看 成 一 个 数 轴 ， 虚 数 看 成 与 实数 垂直 的 正 交 数 轴 ，j 表示 “ 北 
时 针 旋转 90”， 或 者 ,“ 逆 时 针 旋转 mw4”。 


逆 时 针 旋 转 | 逆 时 针 旋转 
90° 90° 


0 ” 实数 轴 
图 3.1 虚数 的 表示 


复数 可 以 看 作 是 二 元 有 序 实数 对 (a, b)， 表 示 为 a + hj， 其 中 ，a 是 实数 部 分 ， 
简称 实 部 ,5b 是 虚数 部 分 ， 简称 虚 部 。 根 据 图 3.1， 复 数 是 实数 在 二 维 平面 空间 旋转 
的 一 种 表示 。 

Python 语言 中 ， 复 数 的 虚数 部 分 通过 后 缀 “J” 或 和 ”来 表示 ， 例 如 : 
12. 3 -5. 6 lL 23c-445. 67e+89j 
蜡 数 部 分 的 数值 都 是 类 型 ,对 于 复数 z, 可 以 用 z.real 


和 友人 得 它 的 实数 部 分 和 族 避 分 ， 例 ， 
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复数 类 型 在 科学 计算 中 十 分 常见 ， 基 于 复数 的 运算 属于 数学 
该 分 支 有 效 支撑 了 众多 科学 和 工程 问题 的 数学 表示 和 求解 。Python 直接 支持 复数 类 
型 ， 为 这 类 运算 求解 提供 了 便利 。 


思考 与 练习 

3.1 ”既然 浮 点 数 可 以 表示 所 有 整数 数值 , Python 语言 为 何 要 同时 提供 整数 和 浮 
点 数 两 种 数据 类 型 ? > 

3.2 ”Python 语言 9 的 = 和 八进制 和 十 六 进 制 表示 分 别 是 什么 ? 

二 进 制 : 、 八 进 制 : 、 十 六 进 制 ; 

3.3 ”Python 语言 中 -77. 的 科学 计数 法 表示 是 什么 ? 4.3e-3 的 十 进 制 表示 是 什 
么 ? 

-77. 的 科学 计数 法 表示 : 。  。 ”、4.3e-3 的 十 进 制 表 示 : 

3.4 复数 2.3e+3-1.34e-3j 的 实 部 和 虚 部 分 别 是 什么 ? 采用 什么 方法 提取 一 个 复 
数 的 实 部 和 虚 部 ? 


3.2 数字 类 型 的 操作 


| i Python 解 科 器 为 数字 类 型 提供 数值 运算 操作 符 、 数 值 运算 函数 
: 型 转换 函数 等 操作 方法 


~ 
Ed 


3.2.1 内 置 的 数值 运算 操作 符 


Python 提供 了 9 个 基本 的 数值 运算 操作 符 , 如 表 3.2 所 示 。 这 些 操作 符 由 Python 
解释 器 直接 提供 ， 不 需要 引用 标 淮 或 第 三 方 函数 库 ， 也 叫做 内 置 操作 入 


表 3.2 ”内置 的 数值 运算 操作 符 〈 共 9 个 ) 


操作 符 | 描述 一 -有人 有 
X 十 y 天 与 之 和 | 
法 = 闻 X 与 y 之 天 
天 让 了 x 与 y 之 积 
x/ly x 与 y 之 商 


xlly x 与 y 之 整数 商 ， 即 不 大 于 x 与 y 之 商 的 最 大 整数 
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续 表 
ER 
x%y 也 称 为 模 运算 
= 六 x 的 负 值 ， 即 x*(-1) 
+x x 本身 
X 半 中 X 的 y 次 震 ， 即 x” 


这 9 个 操作 符 与 数学 习惯 一 致 ， 运 算 结 果 也 符合 数学 意义 。 操 作 符 运 算 的 结果 

可 能 改变 数字 类 型 ，3 种 数字 类 型 之 间 存 在 一 种 逐渐 扩展 的 关系 ， 具 体 如 下 : 
整数 -> 浮 点 数 -> 复数 

这 是 因为 整数 可 以 看 成 是 浮 点 数 没有 小 数 的 情况 ， 浮 点 数 可 以 看 成 是 复数 虚 部 为 0 
的 情况 。 基 于 上 述 扩展 关系 ， 数 字 类 型 之 间 相互 运算 所 生成 的 结果 是 “更 宽 ” 的 类 
型 ， 基 本 规则 如 下 。 

(1) 整数 之 间 运 算 ， 如 果 数 学 意义 上 的 结果 是 小 数 ， 结 果 是 浮 点 数 。 

(2) 整数 之 间 运 算 ， 如 果 数 学 意义 上 的 结果 是 整数 ， 结 果 是 整数 。 

(3) 整数 和 浮 点 数 混合 运算 ， 输 出 结果 是 浮 点 数 。 
(4) 整数 或 浮 点 数 与 复数 运算 ， 输 出 结果 是 复数 。 


表 3.2 中 所 有 二 元 数学 操作 符 (+、-、*、/、//、%、**) 都 有 与 之 对 应 的 增强 
赋值 操作 符 (+=、-=、*=、/=、// 二 、%=、**=)。 如 果 用 op 表示 这 些 二 元 数学 操作 
符 ， 则 下 面 两 个 赋值 操作 等 价 ， 注 意 ，op 和 二 元 操作 符 之 间 没 有 空格 : 

x OPp= Y 
等 价 于 
X= Xopy 
增强 赋值 操作 符 获得 的 结果 写 入 变量 x 中 ， 简 化 了 代码 表达 ， 例 如 ; 


3.2.2 内置 的 数值 运算 函数 


Python 解释 器 提供 了 一 些 内 置 函 数 ，5.8 节 将 给 出 Python 全 部 内 置 函 数列 表 ， 
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在 这 些 内 置 函数 之 中 ， 有 6 个 函数 与 数值 运算 相关 ， 如 表 3.3 所 示 。 
表 3.3 内置 的 数值 运算 函数 ( 共 6 个 ) 


国 妆 i 描述 
abs(x) x 的 绝对 值 
divmod(x, y) (x//y, x%y)， 输 出 为 二 元 组 形式 〈 也 称 为 元 组 类 型 ) 
pow(x, y[, 2]) (xx*#y)%Z，[..] 表 示 该 参数 可 以 省 略 ， 即 pow(x,y)， 它 与 x**y 相同 


round(x[, ndigits]) 对 x 四舍五入， 保留 ndigits 位 小 数 。round(x) 返 回 四 含 五 入 的 整数 值 
IaXx(Xi， 其 2hvsag xX) Xl1, X2,..., Xn 的 最 大 值 ， n 没有 限定 


min(X1, Xz,..., Xn) X1, X2, .…, Xn 的 最 小 值 ，n 没有 限定 


>>>abs (-3+4j) 
Ss0 


pow() 函 数 第 三 个 参数 z 是 可 选 的 ， 使 用 该 参数 时 ， 模 运算 与 究 运 算 同时 进行 ， 
速度 很 快 。 例 如 ， 求 3 的 3” 次 窜 结 果 的 最 后 4 位 。 从 Python 语法 角度 ， 
pow(3,pow(3,999))%10000 (请 不 要 在 计算 机 中 尝试 该 语句 ) 和 pow(3， 
pow(3,999),10000) 都 能 完成 计算 需求 。 但 是 ， 前 者 是 先 求 曙 运算 结果 再 进行 模 运算 ， 
由 于 客运 算 结 果 数 值 巨 大 ， 上 述 计 算 在 一 般 计算 机 上 无 法 完成 ;， 而 第 二 条 语句 则 在 
寡 运 算 同时 进行 模 运 算 ， 可 以 很 快 计算 出 结果 。 例 如 : 


>>>pow(3，Pow(3,999) ,10000) # 宕 运 算 和 模 运算 同时 进行 ， 速 有 
4587 


: Fr 王 要 启用 于 真 看 疝 其 通关 的 声 于 例如 ， 
一 个 星期 7 天 , 用 day 代表 日 期 ， 则 day%7 可 以 表示 星期 ; 对 于 一 个 整数 n, n%2 
: 的 取 值 是 0 或 者 1， 可 以 判断 整数 的 奇偶 本质 上 ， 整 数 的 模 运 算 n%m 能 够 将 
! 整数 nn 映射 到 [0, m-1] 的 区 间 中 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 二 二 一 二 二 一 一 二 


3.2.3 ”内 置 的 数字 类 型 转换 函数 


i WE 


算 符 “/” 的 除法 将 可 能 输出 浮 点 数 结果 。 此 外 ， 通 过 内 置 的 数字 类 型 转换 函数 可 以 
( 显 式 地 在 数字 类 型 之 问 进行 转换 ， 如 表 3.4 所 示 。 


浮 点 数 类 型 转换 为 整数 类 型 时 ， 小 数 部 分 会 被 舍弃 不 使 用 四 售 五 入 )， 复 数 不 能 _ 
直接 转换 为 其 他 数字 类 型 ， 可 以 通过 .real 和 .imag 将 复数 的 实 部 或 虚 部 分 别 转换 ， 例 如 : 


SS 
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表 3. 4 内 置 的 数字 类 型 转换 函数 〔 共 3 个 ) 
站 ER NT 


int(x) 整数 ， 人 
float(x) 将 x 转换 为 运输 


a 生成 一 个 复数 ， a TREE 
complex(re[, im]) | im 可 以 是 整数 或 浮 点 数 但 不 能 为 字符 第 


OP 


阶段 测试 3-1: | 


思考 与 练习 Python 数字 类 型 
小 测试 | 


3.5 思考 各 操作 符 的 优先 级 ， 计 算 下 列表 达 式 。 

(1) 30-3**2+8//3**2*]10 

(2) 3*4**2/8%5 

(3) 2#¥*2**3 

(4) (2.5+1.25j)*4j/2 

3.6 请 将 下 列 数学 表达 式 用 Python 程序 写 出 来 ， 并 运算 结果 。 


I 47 一 3% 克 程序 练习 3- a : 
3 A 半 小 时 学 Python: 
(2) x=(1+3°)x(l6mod7)y/7 =2 数字 类 型 
3.7 ”假设 5 和 2 的 运算 结果 是 什么 ? 
芝 : 下 ID +05 
3.3 模块 1: math 库 的 使 用 


3.3.1 math 库 概 述 


利用 函数 库 编程 是 Python 语言 最 重要 的 特点 ， 也 是 Python 编程 生态 环境 的 意 


ea ey 
>” math 库 


参考 
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义 所 在 。 本 书 不 区 分 E (Library〉 和 模块 (Medule, 
用 的 代码 统称 为 函数 亩 ， 这 种 利用 函数 亩 编程 的 方式 

从 本 节 开 始 ， 本 书 将 随 各 章节 介绍 一 些 常用 的 Python 函数 库 。 这 些 库 分 为 
Python on 其 中 上 默 


要 import 使 


认 支 持 的 函数 库 也 叫做 标准 函数 库 《Standard Library) 或 内 置 函 数 库 。8.5 节 将 详细 
介绍 Python 函数 库 和 模块 编程 思想 。 

math 库 是 Python 提供 的 内 署 数 学 类 函数 库 ， 因 为 复数 类 型 常用 于 科学 计算 ， 
一 般 计算 并 不 常用 ， 因 此 math 库 不 支持 复数 类 型 ， 仅 支持 整数 和 浮 点 数 运算 。math 
库 一 共 提 供 了 4 个 数学 常数 和 44 个 函数 。44 个 函数 共 分 为 4 类 , 包括 16 个 数值 表 
示 函 数 、8 个 震 对 数 函 数 、16 个 三 角 对 数 函 数 和 4 个 高 等 特殊 函数 。 

math 库 中 函数 数量 较 多 ， 读 者 在 学 习 过 程 中 只 需要 逐个 理解 函数 功能 ， 记 住 个 
别 常 用 函数 即 可 。 实 际 编程 中 ， 如 果 需 要 采用 math 库 ， 可 以 随时 查看 本 书 附 录 提 供 
的 math 库 快 速 参考 。 

math 库 中 的 函数 不 能 直接 使 用 , 需要 首先 使 用 保留 字 import 引用 该 库 ， 引 用 方 
式 如 下 。 

第 一 种 : 


import math 


对 math 库 中 函数 采用 math.<b>0 形 式 使 用 ， 例 如 : 


from math import < 函数 名 > 


对 math 库 中 函数 可 以 直接 采用 < 图 数 名 >O 形 式 使 用 ， 例 如 : 


第 二 种 方法 的 另 一 种 形式 是 fom math import *。 如 果 采 用 这 种 方式 引入 math 
库 ，math 库 中 所 有 函数 可 以 采用 < 函数 名 >() 形 式 直 接 使 用 。 

math 库 及 后 续 所 有 函数 库 的 引用 都 可 以 自由 选取 这 两 种 方式 实现 ， 这 与 2.3 节 
介绍 的 turtle 库 是 一 致 的 。 


3.3.2 _ math 库 解 析 


math 库 包 括 4 个 数学 常数 ， ”如 表 3.5 所 示 ; 也 包括 ， 16 个 数值 表示 函数 ， 如 表 
3.6 所 示 。 
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表 3.5 math 库 的 数学 常数 ( 共 4 个 ) 


| x | 圆周 率 ， 值 为 3.141 592 653 589 793 
math.e | ee | 自然 对 数 ， 值 为 2.718 281 828 459 045 

| 2 | 正 无 穷 大 ， 负 无 穷 大 为 -math.inf 

| | 非 浮 点 数 标 记 ，NaN (Not a Number) 

表 3.6 math 库 的 数值 表示 函数 ( 共 16 个 ) 

EE | 
math.fabs(x) 4 返回 x 的 绝对 值 
math.fimod(x, y) 返回 x 与 y 的 横 
math.fsum([x,y,...]) 浮 点 数 精确 求 和 
math.ceil(x) 向 上 取 整 ， 返 回 不 小 于 x 的 最 小 整数 
math.floor(x) 向 下 取 整 ， 返 回 不 大 于 x 的 最 大 整数 


| 返回 x 的 阶乘 ， 如 果 x 是 小 数 或 负数 ， 返 回 
math.factorial(x) 议 1] 
ValueError[ 


math.gcd(a, b) | ”| 返回 a 与 6 的 最 大 公约 数 
math.frepx(x) 返回 (m,e)， 当 0， 返 回 (0.0, 0) 


回 False 
当 x 是 NaN， 返 回 True; 否则 ， 返 回 False 


math.ldexp(x, i) 返回 xx2' 运 算 值 ，math.frepx(x) 函 数 的 反 运 算 
math.modf(x) | ”| 返回 x 的 小 数 和 整数 部 分 
math.trunc(x) Re 返回 x 的 整数 部 分 
math.copysign(x, y) 上 x yl/y 用 数值 y 的 正 负 号 替换 数值 x 的 正 负 号 
math.isclose(a,b) | | 比较 a 和 的 相似 性 ， 返 回 True 或 False 
math.isfinite(x) | |” 妆 * 为 无 穷 大 返回 True; 否则 ， 返 回 False 

本 | -= 当 x 为 正 数 或 负数 无 穷 大 ， 返 回 True;， 否则 ， 返 
math.isinf(x) 

[| 


math.isnan(x) 


math.fsum([x,y,…]) 函 数 在 数学 求 和 运算 中 十 分 有 用 ， 参 考 如 下 例子 : 


浮 点 数 ， 如 0.1、0.2 和 0.3， 在 Python 解释 器 内 部 表示 时 存在 一 个 小 数 点 后 车 
干 位 的 精度 尾数 ， 当 浮 点 数 进行 运算 时 ,这 个 精度 尾数 可 能 会 影响 输出 结果 。 因 此 ， 
在 涉及 浮 点 数 运算 及 结果 比较 时 ， 建 议 采 用 math 库 提供 的 函数 ， 而 不 直接 使 用 
Python 提供 的 运算 符 。 


[1] ValueError 是 Python 编译 器 提供 的 一 种 异常 ， 有 关 异 常 处 理 的 内 容 详 见 4.7 节 。 
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math 包含 8 个 徊 对 数 函 数 ， 如 表 3.7 所 示 。 
表 3.7 math 库 的 宕 对 数 函 数 ( 共 8 个 ) 


函数 | 数学 表示 描述 
.4 
ex 


math.pow(x,y) 返回 x 的 yy 次 帘 


math.exp(x) | ex | 返回 e 的 x 次 星 ，e 是 自然 对 数 


math.expml(x) 返回 e 的 x 次 帘 减 1 


math.sqrt(x) 返回 x 的 平方 根 


math.log(x[,base]) 返回 x 的 对 数值 ， 只 输入 x 时， 返回 自然 对 数 ， 即 In x 
math.loglp(x) 返回 1+x 的 自然 对 数值 

math.log2(x) | logx ”| 返回 x 的 2 对 数值 

math.log10(x) 返回 x 的 10 对 数值 


math 库 没 有 提供 直接 支持 Xx 运算 的 函数 ， 但 可 以 根据 公式 x =x”， 采 用 
math.powO 函 数 求解 ， 参 考 如 下 例子 : 


>>>math.pow(10, 1/3) 
2 Tadeddaledd 


math 包含 16 个 三 角 运 算 函 数 ， 如 表 3.8 所 示 。 
表 3.8 math 库 的 三 角 运 算 函 数 ( 共 16 个 ) 


函数 描述 
math.degree(x) -一 一 角度 x 的 弧度 值 转角 度 值 
math.radians(x) 角度 x 的 角度 值 转 弧 度 值 
math.hypot(x,y) [2 +4 yy 返回 (xy) 坐 标 到 原点 (0.0) 的 距离 
math.sin(x) 返回 x 的 正弦 函数 值 ，x 是 弧度 什 
math.cos(x) 返回 x 的 余弦 函数 值 ，x 是 弧度 值 
math.tan(x) 返回 x 的 正切 函数 值 ，x 是 弧度 什 
math.asin(x) 返回 x 的 反正 弦 函 数值 ，x* 是 弧度 值 
math.acos(x) 返回 x 的 反 余弦 函数 值 ，x 是 弧度 值 
math.atan(x) 返回 x 的 反正 切 函 数值 ，x 是 弧度 值 
math.atan2(y,x) 返回 wx 的 反正 切 函数 值 ，x 是 弧度 值 
math.sinh(x) sinh x 返回 x 的 双 曲 正弦 函数 值 
math.cosh(x) 返回 x 的 双 曲 余弦 函数 值 
math.tanh(x) 返回 x 的 双 曲 正切 函数 什 
math.asinh(x) 返回 x 的 反 双 曲 正弦 函数 值 
math.acosh(x) 返回 x 的 反 双 曲 余弦 函数 值 
math.atanh(x) arctanh x 返回 x 的 反 双 曲 正切 函数 值 


arctan 1 的 值 是 二， 利用 math 库 的 atan0) 函 数 得 到 r 值 如 下 : 
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表 3.9 math 库 的 高 等 特殊 函数 ( 共 4 个 ) 


| a pe . 描 ，- 人 
2 px -到 | 
math.erf(x) he dt 高 斯 误差 函数 ， 应 用 于 概率 论 、 统 计 学 等 领域 
2 = - 
math.erfc(x) 让 ed 余 补 高 斯 误差 函数 ，math.erfc(x)=]1 - math.erf(x) 
mathgammalx) | | ze de | 徊 到 (Gamma) 函数 ， 也 叫 欧 拉 第 二 积分 函数 


伽 玛 函数 的 自然 对 数 


| 大 1) x 为 
是 褒 并 ) 


a ee 
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思考 与 练习 

3.8 请 利用 math 库 运 行 下 面 语句 ， 获 得 计算 结果 。 

(1) math.sin(2*math.pi) (2) math.floor(—2.5) 

(3) math.ceil(3.5+math.floor(—2.5)) (4) round(math.fabs(—2.5)) 

($5) math.sqrt(math.pow(2,4)) (6) math.log(math.e) 

(7) math.gcd(12,9) (8) math.fmod(36,5) 
J 2 3.9 请 利用 math 库 将 47° 的 角 转 换 为 弧度 制 ， 并 将 结果 赋 给 一 个 变量 。 
i i 3.10 请 利用 math 库 将 = 的 弧度 值 转换 为 角度 值 ， 并 将 结果 赋值 给 一 个 变量 。 
5 3.11 math 库 有 44 个 函数 ，Python 计算 生态 有 超过 10 万 个 各 类 函数 库 ， 思 考 


图 和 ,加 一 下， 该 怎么 学 习 这 些 函 数 库 呢 ? 


3.4 实例 3: 天 天 向 上 的 力量 


”国语 ”这 是 一 组 测试 “天 天 向 上 ”力量 的 Python 数学 实例 。 ) 


-=== 


1951 年 ， 毛 泽 东 主席 题词 “好 好 学 习 、 天 天 向 上 ”， 成 为 激励 一 代 代 中 国人 耕 
发 图 强 的 经 典 短语 。 那 么 “天 天 癌 上 ”的 力量 有 多 强大 呢 ? 这 里 用 Python 程序 来 演 
算 一 下 吧 。 

【实例 代码 3.1】 天 天 向 上 。 

一 年 365 天 ， 以 第 1 天 的 能 力 值 为 基数 ， 记 为 1.0， 当 好 好 学 习 时 能 力 值 相 比 
前 一 天 提高 1%o， 当 没有 学 习 时 能 力 值 相 比 前 一 天 下 降 1%o。 每 天 努力 和 每 天 放任 ， 
一 年 下 来 的 能 力 值 相差 多 少 呢 ? 

根据 题目 ， 天 天 向 上 的 力量 是 (1+0.001)5， 放 任 或 向 下 的 力量 是 (1-0.001)365， 
代码 如 下 : 


实例 代码 3.1 e3.1DayDayUp365.py 

证 #e3.1DayDayUp365 .py 

2 import math 

3 | dayup = math.pow((1.0 + 0.001)，365) # 提高 0.001 

4 | daydown = math.pow((1.0 - 0.001)，365) # 放任 0.001 

5 | Print(" 向 上 : {:.2£}, 向 下 : {:.2£f}.".format(dayup, daydown)) 


程序 运行 结果 如 下 ， 每 天 努力 1%， 一 年 下 来 将 提高 44%， 好 像 不 多 ? 请 继续 
分 析 。 


ee a 
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【实例 代码 3.2】 天 天 向 上 。 
一 年 365 天 ， 如 果 好 好 学 习 时 能 力 值 相 比 前 一 天 提高 5%， 当 放任 时 相 比 前 一 
天 下 降 $%o， 效 果 相 差 多 少 呢 ? 


天 天 向 上 的 力量 是 (1+0.005)“*， 相 反 则 是 (1-0.005)“， 代 码 如 下 : 源 代码 32， 天 天 | 
可 上 的 力量 
实例 代码 eM e3.2DayDayUp365.py .和 上 Se 人 se 
1 #e3 .2DayDayUP365 .py 回 回 
有 import math 
3 | dayup = math.pow((1.0 + 0.005)，365) # 提高 0.005 
4 | daydown = math:pow((1.0 - 0.005)，365) # 放任 0.005 @] = 
本 Print (" 向 上 半 {: .2£} 向 下 : {:.2£}.".format (dayup, daydown) ) 
程序 运行 结果 如 下 ， 每 天 努力 $%o， 一 年 下 来 将 提高 6 倍 ! 这 不 容 小 舰 了 吧 ? 
【实例 代码 3.3】 和 天 天 向 上 。 
一 年 365 天 ， 如 果 好 好 学 习 时 能 力 值 相 比 前 一 天 提高 1%， 当 放任 时 相 比 前 一 
天 下 降 1%。 效 果 相 差 多 少 呢 ? 
此 时 , 天 天 向 上 的 力量 是 (1+0.01)”“， 相反 的 力量 是 (1-0.01)“。 从 0.001、0.005 
到 0.01， 这 个 每 天 努力 的 因素 根据 需求 的 不 同 而 不 断 变 化 ， 因 此 ， 新 代码 中 采用 
dayfactor 变量 表示 这 个 值 。 这 种 改变 的 好 处 是 每 次 只 需要 修改 这 个 变量 值 即 可 ， 而 
不 需要 修改 后 续 与 该 变量 相关 位 置 的 代码 。 代 码 如 下 : 
实例 代码 3.3 e3.3DayDayUp365.py 源 代 码 3-3: A 
3 
#e3.3DayDayUp365.py 
import math 口 回 


dayfactor = 0.01 

dayup = math.pow((1.0 + dayfactor), 365) # 提高 dayfactor 

daydown = math.pow((1.0 - dayfactor), 365) # 放任 dayfactor 国 
print(" 向 上 : {:.2f}， 向 下 : {:.2f}.".format(dayup, daydown)) 


OP 


程序 运行 结果 如 下 ， 每 天 努力 1%， 一 年 下 来 将 提高 37 倍 。 这 相当 惊人 吧 ! 


【实例 代码 3.4】 天 天 向 上 。 
一 年 365 天 ， 一周 5 个 工作 日 ， 如 果 每 个 工作 日 都 很 努力 ， 可 以 提高 1%， 仅 
在 周末 放任 一 下 ， 能 力 值 下 降 1%， 效 果 如 何 呢 ? 
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当前 水 平 值 为 N， 则 工作 日 水 平 变 化 是 Nx(1+0.01)， 非 工作 日 是 Nx(1-0.01)。 
由 于 水 平 值 并 非 每 天 都 乘 以 相同 系数 ， 因 此 ， 这 个 程序 采用 循环 方式 实现 。 代 码 


如 下 : 
. 。 。 _ 实 例 代码 3.4 e3.4DayDayUp365.py 
1 #e3.4DayDayUp365.py 
2 dayup, dayfactor = 1.0, 0.01 
3 for i in range (365): 
4 1f 主 和 了 En [6 01: 
5 dayup = dayup * (1 + dayfactor) 
6 else: 
dayup = dayup * (1 - dayfactor) 
8 | print ("向 上 5 天 向 下 2 天 的 力量 : {:.2f}.".format (dayup)) 


I 每 周 努力 5 天 ， 而 不 是 每 天 ， 一 年 下 来 ， 水 平 仅 是 初始 的 4.63 
与 每 天 坚持 所 提高 的 37 倍 相去 其 远 。 


>>> 7 
向 上 5 天 向 下 2 天 的 力量 : 4.63 


【实例 代码 3.5】 天 天 向 上 。 

如 果 对 实例 代码 3.4 的 结果 感到 意外 ， 那 目 然 会 有 如 下 疑问 : 每 周 工作 5 天 ， 
休息 2 天， 休息 日 水 平 下 降 0.01， 工 作 日 要 努力 到 什么 程度 ， 一 年 后 的 水 平 才 与 每 
天 努力 1% 取 得 的 效果 一 样 呢 ? 

这 个 计算 问题 有 很 多 种 求解 方法 , 这 里 采用 通过 多 次 运算 求解 问题 的 解决 方案 ， 
即 由 程序 从 低 到 高 逐渐 增加 每 天 努力 的 程度 值 ， 当 运算 结果 刚刚 超过 1.0 时 ， 这 个 
努力 值 就 是 上 述 问题 的 解 。 这 种 方案 中 ， 类 似 实例 代码 3.4 的 程序 会 被 频繁 调用 ， 
因此 ， 可 以 通过 保留 字 def 定义 一 个 求解 天 天 向 上 的 函数 ， 这 样 将 能 更 好 地 提升 程 
序 可 读 性 。 代 码 如 下 : 


县 人 得 3 5 实例 代码 3.5 e3.5DayDayUp365.py 
ee es . LT #e3.5DayDayUp365 .py 
口 [a] 2 | def dayUP (df): 
3 dayup = 0.01 
4 for i in range (365): 
= 5 if i % 7 in [6, 0]: 
国 FE 6 dayup = dayup * (1 - 0.01) 
量 else: 
8 dayup = dayup * (1 + df) 
3 return YU 
10 | dayfacotr = 0.01 
:1 


while (dayUP (dayfactor)<37.78): 
A 
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12 | dayfactor += 0.001 
13 | Print(" 每 天 的 努力 参数 是 : {:.3f}.".format(dayfactor)) 


实例 代码 3.5 第 9 行 采用 保留 字 return 将 函数 dayUP() 的 运行 结果 返回 。 程序 运 
行 结果 如 下 : 


>>> 


每 天 的 努力 参数 是 : 0.019. 


对 比 实例 代码 3.3 和 3.5 的 运行 结果 ， 每 天 努力 1%， 坚 持 365 天 不 间断 ， 一 年 
下 来 1.0 的 初始 水 平 可 以 提高 37 倍 ! 而 如 果 每 周 连续 努力 5 天 ,休息 2 天 ， 为 了 达 
到 每 天 努力 1% 所 达到 的 水 平 ， 则 需要 在 工作 日 将 提高 的 程度 达到 约 2%， 即 要 努力 
1 倍 才 仅 是 为 了 休息 2 天 。 这 就 是 天 天 向 上 的 力量 ! 
丘 展 : GRIT: 成 功 的 关键 

Grit 原 义 是 砂砾 ， 即 砂 堆 中 坚硬 耐 麻 的 颗粒 。 这 里 ，GRIT 是 gritty ( 坚 册 不 

' 拔 的 ) 的 名 词 ， 由 美国 宾夕法尼亚 大 学 心理 学 教授 Angela Duckworth 提出 ， 与 中 
! 文中 “ 坚 才 ” 的 含义 最 为 接近 。Duckworth 教授 曾经 在 纽约 一 所 公立 中 学 讲授 初 

一 数学 ， 她 很 快 发 现 智商 并 不 是 区 分 成 功 和 那些 挣扎 但 最 后 失败 的 学 生 的 唯一 标 ， 
受 这 段 经 历 启发 ， 她 于 2005 年 在 宾夕法尼亚 大 学 开拓 并 发 展 了 这 个 概念 ， | 
! 黄 定 了 GRIT 研究 的 基础 ， 研 究 表明 : 成 功 的 先兆 不 是 智商 ， | 
' 持 ， 这 是 “坚毅 ”的 力量 。 
GRIT 是 对 长 期 目标 的 持续 激情 及 持久 耐力 ， 是 不 忘 初衷 、 专 注 投 入 、 坚持 ， 
' 不 懈 ， 是 一 种 包涵 了 自我 激励 、 自 我 约束 和 自我 调整 的 性 格 特征 。GRIT 研究 的 
' 重要 价值 在 于 它 给 教育 发 出 警示 : 决定 成 功 最 重要 的 因素 ， 不 在 于 教育 过 程 灌 ， 
' 输 了 多 少 知识 ， 而 在 于 教育 是 否 帮 助 学 习 者 建立 了 “坚毅 ”的 性 格 ， 后 者 则 是 成 ， 
' 功 的 决定 因素 . Duckworth 教授 的 著作 GRIT: The Power of Passion and ， 
! Perseverance 已 经 成 为 解释 “坚毅 ”力量 的 经 典 作 品 ， ies ia nr i ig 
! 书籍 . 
早 在 100 年 前 ， WA 
' 领袖 、 企 业 家 、 处 善 家 、 曾 经 的 华人 首富 陈嘉庚 先生 提出 了 “ 诚 裔 ”二 字 ， 他 在 ， 
' 烽火 战争 年 代 坚 持 投身 教育 事业 ， 先 后 创办 了 厦门 大 学 、 集 美 大 学 ， 用 一 生 的 实 ， 
或 诠释 了 获得 成 功 的 关键 . “ 诚 才 "， 即 “ 诚 以 待人 ， 抽 以 处 事 "， 被 誉 为 “ 陈 嘉 ， 
\ 庚 精神 ”的 核心 ， 也 成 为 集美 大 学 的 校训 。 ， 


思考 与 练习 5S POD | 0+N hsx GD 
3.12 一 年 365 天 ,初始 水 平 值 为 1.0， 每 工作 天 水 平 增加 ,不 于 作 时 水 平 | 
不 下 降 ， 一 周 连续 工作 4 天 ， 请 编写 程序 运算 结果 开 顶 写 下 表 ， 


voor | ona T i005 | on0r | on05 | 0000 0007 | oo08 [0005 
2 i a 
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3.13 一 年 365 天 ， 初 始 水 平 值 为 1.0， 每 工作 一 天 水 平 增 加 W， 不 工作 时 水 平 
不 下 降 ， 一 周 连续 工作 5 天 ， 请 编写 程序 运算 结果 并 填写 下 表 。 


3.14 一 年 365 天 ， 初 始 水 平 值 为 1.0， 每 工作 一 天 水 平 增加 N， 不 工作 时 水 平 
不 下 降 ， 一 周 连 续 工 作 6 天 ， 请 运算 结果 并 填写 下 表 。 


3.15 一 年 360 和 天， 初始 水 平 值 为 1.0， 以 每 个 月 30 天 计算 ， 在 每 个 月 月 初 连 
续 10 天 里 ， 每 工作 一 天 水 平 增加 入, 该 月 其 他 时 间 工 作 与 否 都 不 增加 水 平 值 。 请 运 
算 结 果 并 填写 下 表 。 


: 字符 事 是 字符 的 序列 表示 ， 可 以 通过 基本 的 字符 于 操作 符 、 内 于 字 
. 符 事 处 理 函 数 和 字符 囊 处 理 方法 等 对 字符 率 进 行 操作 。 Te. 


a Ed 


3.5.1 字符 串 类 型 的 表示 


字符 串 是 字符 的 序列 表示 ， 可 以 由 一 对 单 引号 〈")、 双 引 或 三 绚 咏 -《") 
构成 。 其 中 ， 单 引号 和 双 引 号 都 可 以 表示 单行 次 符 串 ， 两 者 作 用 相同 。 使 用 单 引号 _ 
时 ， 双 引号 可 以 作为 字符 串 的 一 部 分 ;使 用 双 引 号 时 ， 单 引号 可 以 作为 字符 串 的 一 
部 分 。 三 引号 ee 示 方式 如 下 。 
单 引 号 字符 串 : 单 身 表示 ， 可 以 重用 " 双 引号 "作为 字符 串 的 一 部 分 
双 引 号 字符 串 : " 双 引 号 表示 ， 可 以 使 用 单 引 号 ' 作 为 字符 串 的 一 部 分 " 
三 引号 字符 串 : "三 引号 表示 可 以 使 用 " 双 引 号 " 
单 引 号 ' 
也 可 以 换行 
和 二 果 如 下 ， 注 意 其 中 的 引号 部 分 : 


人 使 用 " 
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inputO 函 数 将 用 户 输入 的 内 容 当 作 一 个 字符 串 类 型 ， 这 是 获得 用 户 输入 的 常用 
方式 。print0 函 数 可 以 直接 打印 字符 串 ， 这 是 输出 字符 串 的 常用 方式 。 如 下 例子 展 


dab name 来 存储 用 户 的 名 字 ， 再 输出 这 个 变量 的 内 容 : 


侧 字 符 序号 为 L-1; 后 出 洪 滴 这 只 以 需 右 由 学 笠 隐 网- 1， 向 左 依次 递减 最 左 侧 
字符 序号 为 -L。 这 两 种 索引 字符 的 方法 可 以 在 一 个 表示 中 使 用 。 
Python 字符 串 也 提供 区 间 访 问 方式 ， 采 用 [N: MI 格式 ， 表 示 字 符 串 中 从 NN 到 MM 


(不 包含 M) 的 子 字 符 串 ， 其 中 ,和 MM》 ade es i 可 以 混合 使 用 正 向 
Cae eh 如 果 表示 中 MM 或 者 Re 示 字 符 叮 把 开始 


对 此， 字符 囊 Ce (rk) 


有 反 斜 杠 字符 (\) 是 一 个 特殊 字符 ， 在 字符 串 中 表示 转 义 ， 即 该 字符 与 后 面相 邻 


| 源 代码 3-6: 
;获取 星期 字符 串 


9 _ 微 实 例 3.1 m3.1PrintWeekname. 
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的 一 个 字符 共同 组 成 了 新 的 含义 。 例 如 ，n 表示 换行 、\ 表 示 反 斜 本、\ 表 示 单 引号 、 
\” 表 示 双 引号 、\ 表示 制 表 符 〈Tab) 等 。 例 如 : 


3.5.2 ”基本 的 字符 串 操作 符 


Python 提供 了 5 个 字符 串 的 操作 符 ， 如 表 3.10 所 示 。 
表 3.10 ”基本 的 字符 串 操 作 符 ( 共 5 个 ) 


bn 


X*n 或 n*x 复制 n 次 字符 串 x 

xins 如 果 x 是 s 的 子 串 ， 返 回 True， 和 否则 返回 False 

str[i] 索引 ， 返 回 第 i 个 字符 

str[N: M] 切片 ， 返 回 索引 第 W 到 第 M 的 子囊 ， 其 中 不 包含 MM 
与 字符 串 操作 符 有 关 的 实例 如 下 : 


【 微 实例 3.1】 获 取 星 期 字符 串 。 
程序 读 入 一 个 表示 星期 几 的 数字 〈1 一 7)， 输 出 对 应 的 星期 字符 串 名 称 。 例 如 ， 


1 | weekstr = "星期 一 星期 二 星期 三 星期 四 星期 五 星期 六 星期 日 " 
2 | weekid = eval (input(" 请 输入 星期 数字 (1-7) : ")) 

3 Pos = (weekid - 1)*3 

4 prinE (weekstr[pos: pos+3]) 
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i ei 


微 实例 3.1 通过 在 字符 串 中 截取 适当 子 申 实现 星期 名 称 的 查找 问题 的 关键 在 
于 找 出 子 串 的 剪 切 位 置 。 因 为 每 个 星期 日 期 的 缩写 都 由 3 个 字符 组 成 ， 如 果 知 道 星 
期 日 期 字符 串 的 起 始 位 置 ， 就 能 很 容易 获得 缩写 子 串 。 通 过 下 面 语 句 ， 可 以 获得 从 
起 始 位 置 pos 开始 且 长 度 为 3 的 子 串 : 


weekAbbr = weekstr[pos: pos+3] 


使 用 字符 串 作 为 查找 表 的 缺点 是 ， 所 剪 切 的 子 字符 串 长 度 必 须 相 同 。 如 果 各 缩 
写 表 示 长 度 不 同 ， 还 需要 其 他 语句 辅助 。 例 如 ， 请 读者 思考 ， 该 如 何 实现 一 个 “ 获 
取 月 份 字符 串 ” 呢 ? 要 求 根据 1 一 12 的 数字 返回 月 份 名 称 。 


括 展 : 特殊 的 格式 化 控制 字符 

”字符 事 中 可 以 增加 特殊 的 格式 化 控制 字符 ， 用 来 输出 特殊 效果 。 特 殊 的 格式 
| 化 控制 字符 使 用 反 儿 杠 (\) 开头 ， 常用 控制 字符 如 下 。 ! 
\a: 蜂 鸣 ， 响 铃 。 ! 
\b: 回 退 ， 向 后 退 一 格 。 
\f: 换 页 。 : 
' tn: 换行 ， 光 标 移动 到 下 行 首 行 。 
\r: 回 车 ， 光 标 移动 到 本 行 首 行 。 
Wt 水 平 制 表 。 
\V: 垂直 制 表 。 ! 

\0: NULL， 什么 都 不 做 。 

并 这 北村 机 汪 特 牙 双 衬 特 定 显示 效果 如 下 : 


: 需要 注意 的 是 ,IDLE 开发 环境 不 支持 部 分 竺 环 控制 字符 ， 比 如 Wb 各 等， 使 
' 用 这 些 控制 符 的 程序 需要 编写 代码 保存 为 py 文件 ， 然 后 在 命令 行 下 执行 。 Ee 


"SHS DT SR 


3.5.3 ”内 置 的 字符 串 处 理 函 数 


Python 解释 器 提供 了 一 些 内 置 函数 ， 详 细 请 参考 5.8 节 。 其 中 ， 有 6 个 函数 与 
TO 和 全 和 
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表 3.11 内 置 的 字符 串 处 理 函 数 ( 共 6 个 ) 


函数 过 达 轩 rs | 
len(x) 返回 字符 串 x 的 长 度 ， 也 可 返回 其 他 组 合 数据 类 型 元 素 个 娄 一 
str(x) 返回 任意 类 型 x 所 对 应 的 字符 串 形式 
chr(x) 返回 Unicode 编码 x 对 应 的 单字 符 
ord(x) 返回 单字 符 表 示 的 Unicode 编码 
hex(x) 返回 整数 x 对 应 十 六 进 制 数 的 小 写 形式 字符 串 
oct(x) 返回 整数 x 对 应 八进制 数 的 小 写 形式 字符 串 


ee 其 中 ，x 可 以 是 数字 类 型 或 其 他 类 型 ， 例 如 : 


每 个 字符 在 计算 机 中 可 以 表示 为 一 个 数字 ， 称 字符 串 则 以 编码 序列 方 
式 存储 在 计算 机 中 。 目 前 ， 计 算 机 系统 使 用 的 一 个 重要 编码 是 ASCII 编码 ， 该 编码 
用 数字 0 一 127 表示 计算 机 键盘 上 的 常见 字符 以 及 一 些 被 称 为 控制 代码 的 特殊 值 例 
如 ， 大 写字 母 A~Z 用 65 一 90 表示 ， 小 写字 母 a~z 用 97 一 122 表示 。 

ASCII 编码 针对 英语 字符 设计 , 它 没 有 覆盖 其 他 语言 存在 的 更 广泛 字符 ，, 因此， 
现代 计算 机 系统 正 逐 步 支 持 一 个 更 大 的 编码 标准 Unicode， 它 支持 几乎 所 有 书写 语 
言 的 字符 。Python 字符 串 中 每 个 字符 都 使 用 Unicode 编码 表示 。 

chr(x) 和 ord(x) 函 数 用 于 在 单字 符 和 Unicode 编码 值 之 间 进 行 转换 。chr(x) 函 数 
返回 Unicode 编码 对 应 的 字符 ， 其 中 ，Unicode 编码 x 的 取 值 范围 是 0 到 1 114 111 
《 即 十 六 进 制 数 0x10FFFF )。ord(x) 函 数 返 回 单字 符 x 对 应 的 Unicode 编码 。 例 如 ; 


hex(x) 和 oct(x) 函 数 分 别 返 回 整数 x 对 应 十 六 进 制 和 八进制 值 的 字符 串 形式 , 字 
符 串 以 小 写 形式 表示 。 例 如 : 


【 微 实例 3.2】 恺 撤 密 码 。 

设想 在 某 些 情况 下 给 朋友 传递 字条 信息 ， 但 又 不 希望 传递 中 途 被 第 三 方 看 懂 这 
些 信息 ， 因 此 需要 对 字条 信息 进行 加 密 处 理 。 传 统 加 密 算法 很 多 ， 这 里 介绍 一 种 非 
常 简单 的 加 密 算 法 一 一 凯撒 密码 。 凯 撤 密码 是 古 罗 马凯 撤 大 帝 用 来 对 军事 情报 进行 
加 密 的 算法 ， 它 采用 了 替换 方法 对 信息 中 的 每 一 个 英文 字符 循环 替换 为 字母 表 序列 
中 该 字符 后 面 第 三 个 字符 ， 对 应 关系 如 下 。 
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原文 ABCDEFGHIJKLMNOPQRSTUVWXYZ 

窗 文 : DEFGHIJKLMNOPQRSTUVWXYZABC 

原文 字符 P， 其 密 文字 符 C 满足 如 下 条 件 : 

C=(P+3)mod26 

解密 方法 反之 ， 满 足 : 

P=(C—-3)mod26 

假设 用 户 可 能 使 用 的 信息 仅 包括 小 写字 和 母 a 一 z， 则 该 微 实例 对 应 的 加 密 代 码 
如 下 : 


微 实 例 3.2 m3.2 CaesarCode.py 


plaincode = input ("请 输入 明文 : ") 
for p in plaincode: 
if ord("a") <= ord(p) <= ord("z"): 
print(chr(ord("a") + (ord(P) - ord("a") + 3)%26), end="'') 
else: 


[oS 


Print(p, end="'"') 


微 实 例 运行 结果 如 下 : 


[EC 
下 


请 读者 参考 微 实例 3.2 编写 凯撒 密码 的 解密 程序 。 男 外 ，6.7 节 将 介绍 一 个 与 恺 
撒 密 码 相似 的 加 解密 算法 ， 代 码 更 为 精炼 。 


3.5.4 ”内 置 的 字符 串 处 理 方法 


在 Python 解释 器 内 部 , 所 有 数据 类 型 都 采用 面向 对 象 方式 实现 , 封装 为 一 个 类 。 
字符 串 也 是 一 个 类 ， 它 具有 类 似 <a>.<b>0) 形 式 的 字符 串 处 理 函 数 。 在 面向 对 象 中 ， 
这 类 函数 被 称 为 “方法 ”。 字 符 串 类 型 共 包含 43 个 内 置 方法 。 鉴 于 部 分 内 置 方法 并 
不 常用 ， 限 于 篇 幅 ， 这 里 仅 介 绍 其 中 16 个 常用 方法 ， 如 表 3.12 所 示 〈 其 中 str 代表 
字符 串 或 变量 )。 


表 3.12 ”常用 的 内 置 字符 串 处 理 方法 ( 共 16 个 ) 


六 由 法 二 
str.lower() 返回 字符 串 str 的 副本 ， 全 部 字符 小 
str.upper() 返回 字符 串 str 的 副本 ， 全 部 字符 大 写 
str.islower() 当 str 所 有 字符 都 是 小 写 时 ， 返 回 True 否则 返回 False 
str.isprintable() 返回 True, 否则 返回 False 


str. isnumeric() 当 str 所 有 字符 都 是 数字 时 ， 返 回 True， 否 则 返回 False 
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续 表 

方 法 本 I 1 描 | 述 ? ] | 下 [ = YW | 
str.isspace() 当 str 所 有 字符 都 是 空格 ， 返 回 True， 否 则 返回 False 
str.endswith(suffix[,start[,end]]) str[start: end] 以 suffix 结尾 返回 True， 和 否则 返回 False 


str.startswith(prefix[, start[, end]]) str[start: end] 以 prefix 开始 返回 True， 否 则 返回 False 
str.split(sep=None, maxsplit=-1) 返回 一 个 列表 ， 由 str 根据 sep 被 分 隔 的 部 分 构成 


str.count(subl[,start[,end]]) 返回 str[start: end] 中 sub 子 串 出 现 的 次 数 

ey a , 返回 字符 串 str 的 副本 ， 所 有 old 子 串 被 替换 为 new， 如 
steep ace( eld mew eonnt)) 果 count 给 出 ， 则 前 count 次 old 出 现 被 替换 
str.center(width[, fillchar]) 字符 串 居中 函数 ， 详 见 函 数 定义 

2 返回 字符 串 str 的 副本 ， 在 其 左 侧 和 右 侧 去 掉 chars 中 列 
str.strip([chars]) 出 的 字符 
A a str 的 副本 ， 长 度 为 width， 不 足 部 分 在 左 侧 ~ 
str. format() ” 返 何 字 符 串 str 的 一 种 排版 格式 ，3.6 节 将 详细 介绍 
a i 返回 一 个 新 字符 串 , 由 组 合 数据 类 型 ( 见 第 6 章 ) iterable 
] 变量 的 每 个 元 素 组 成 ， 元 素 间 用 str 分 隔 


strsplit(sep=None，maxsplit=-1) 方 法 返回 一 个 列表 ， 列 表 是 一 种 存储 多 个 数据 的 
数据 类 型 ，6.2 节 将 详细 介绍 ， 其 中 ， 分 隔 str 的 标识 符 是 sp， 默 认 分 隔 符 为 空格 。 
如 果 给 出 maxsplit 参数 , 则 只 分 隔 前 maxsplit 个 字符 , 默认 maxsplit 参数 可 以 不 给 出 。 

str.center(width[, fillchar]) 方 法 返回 长 度 为 width 的 字符 串 ， 其 中 ，str 处 于 新 字符 
串 中 心 位 置 ， 两 侧 新 增 字 符 采用 身 lchar 填充 ， 当 width 小 于 字符 串 长 度 时 ， 返 回 str。 

strzfill(width) 方 法 返回 长 度 为 width 的 字符 串 ， 如 果 字 符 串 长 度 不 足 width， 在 
左 侧 添加 字符 "0", 但 如 果 str 最 左 侧 是 字符 "+" 或 者 "-", 则 从 第 二 个 字符 左 侧 添加 "0"， 
当 width 小 于 字符 串 长 度 时 ， 返 回 str。 该 方法 主要 用 于 格式 化 数字 形 字符 串 中 。 

表 3.12 中 给 出 的 方法 在 字符 串 处 理 时 十 分 有 用 ， 这 里 仅 给 出 少数 例子 ， 请 读者 


3.16  s= "hello"， 人 二 "world"，s+=t， 则 s、s[-1]、s[2:8]、s[::3]、s[-2::-1] 分 别 是 
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多 少 ? 
3.17 判断 题 ，Python 中 "4"+"5" 结 果 为 '9。 A SU 
3.18 ”采用 微 实例 3.1 的 设计 思路 还 能 完成 哪些 常用 计算 需求 ? _) 
3.19”s="Python String"， 写 出 下 列 操作 的 输出 结果 : 
s.upper()、 s.lower()、 s.find('i'’) 
s.replace('ing', \')、, s.split(' 一 
320 个 从 六 有 

A. ‘abcd'<'ad xX B. ‘abc'<abcd xX/ 
,< D. 'Hello'>'hello' 


So =-2 


为 什么 会 有 字符 串 类 型 的 格式 化 问题 呢 ? 例如 ， 一 个 程序 希望 输出 如 下 内 容 : 

“2016-12-31: 计算 机 PYTHON 的 CPU 占用 率 为 10%。” 

其 中 ， 下 画 线 内 容 可 能 会 变化 ， 需 要 由 特定 函数 运算 结果 进行 填充 ， 最 终 形 成 
上 述 格式 字符 串 作为 输出 结果 。 字 符 串 格式 化 用 于 解决 字符 串 和 变量 同时 输出 时 的 
格式 安排 。 

字符 串 是 程序 向 控制 台 、 网 络 、 文 件 等 介质 输出 运算 结果 的 主要 形式 之 一 ， 为 
了 能 提供 更 好 的 可 读 性 和 灵活 性 ， 字 符 串 类 型 的 格式 化 是 运用 字符 串 类 型 的 重要 内 
容 之 一 。Python 语言 同时 支持 两 种 字符 串 格式 化 方法 ， 一 种 类 似 C 语言 中 printtOD 
函数 的 格式 化 方法 ， 支 持 该 方法 主要 考虑 与 大 批 C 语言 程序 员 编程 习惯 相 一 致 ， 另 
一 种 采用 专门 的 str.format() 格 式 化 方法 。 由 于 Python 中 更 为 接近 自然 语言 的 复杂 数 
据 类 型 (如 列表 和 字典 等 ) 无 法 通过 类 C 的 格式 化 方法 很 好 表达 ，Python 已 经 不 在 
后 续 版 本 中 改进 C 风格 格式 化 方法 。Python 语言 将 主要 采用 format() 方 法 进行 字符 
串 格 式 化 。 本 书 所 有 例子 均 采 用 该 方法 ， 建 议 读者 尽量 使 用 该 方法 。 


3.6.1 formatO 方 法 的 基本 使 用 


字符 串 format() 方 法 的 基本 使 用 格式 如 下 : 

< 模板 字符 串 > .format (< 逗号 分 隔 的 参数 >) 

模板 字符 串 由 一 系列 模 组 成 ， 用 来 控制 修改 字符 串 中 嵌入 值 出 现 的 位 置 ， 其 基 
本 思想 是 将 format( 方 法 中 逗号 分 隔 的 参数 按照 序号 关系 替换 到 模板 字符 串 的 槽 中 。 
槽 用 大 括号 〈 仓 ) 表示 ， 如 果 大 括号 中 没有 序号 ， 则 按照 出 现 顺序 替换 ， 如 图 3.2 


[1] printfO) 函 数 是 C 语言 中 向 控制 台 输 出 信息 的 主要 函数 , 类 似 Python 语言 中 的 print0) 函 数 。 
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所 示 。 如 果 大 括号 中 指定 了 使 用 参数 的 序号 ， 按 照 序号 对 应 参数 蔡 换 ， 如 图 3.3 所 
示 ， 参 数 从 0 开始 编号 。 调 用 format0 方 法 后 会 返回 一 个 新 的 字符 串 。 例 如 : 


"ft 3}: 计算 机 { 3} 的 cPU 占 用 率 为 { }#s- ".format("2016-12-31","PYTHON" ,10) 


{| 1 | | {1 


0 1 2 0 1 2 
字符 串 中 槽 全 的 顺序 formatO 中 参数 的 顺序 


图 3.2 format() 方 法 的 覃 顺序 和 参数 顺序 


"flj: 计算 机 10} 的 cPU 占 用 率 为 {2}$。".format ("2016-12-31", "PYTHON" ,10) 


图 3.3 format() 方 法 槽 与 参数 的 对 应 关系 


format() 方 法 可 以 非常 方便 地 连接 不 同类 型 的 变量 或 内 容 ， 如 果 需 要 输出 大 括 
号 ， 采用 {{ 表 示 ，}} 表 示 }， 例 如 : 


3.6.2 formatO 方 法 的 格式 控制 


formatO 方 法 中 模板 字符 串 的 槽 除了 包括 参数 序号 ， 还 可 以 包括 格式 控制 信息 。 
此 时 ， 权 的 内 部 样式 如 下 : 

{< 参数 序号 >: < 格式 控制 标记 >} 

其 中 ， 格 式 控制 标记 用 来 控制 参数 显示 时 的 格式 ， 格 式 内 容 如 图 3.4 所 示 。 


< 类 型 > 


引导 | 用 于 填充 的 槽 的 设 定 输 i 浮 点 数 小 数 

符号 | 单个 字符 出 宽度 隔 符 bjc,do,x,X 
浮 点 数 类 型 
€,E,f,% 


图 3.4 槽 中 格式 控制 标记 的 字段 
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格式 控制 标记 包括 < 填充 >、< 对 齐 >、< 宽 度 >、<，>、<. 精 度 >、< 类 型 >6 个 字 
段 ， 这 些 字段 都 是 可 选 的 ， 可 以 组 合 使 用 ， 这 里 按照 使 用 方式 逐一 介绍 。 

< 宽度 >、< 对 齐 > 和 < 填充 > 是 3 个 相关 字段 。< 宽 度 > 指 当前 槽 的 设 定 输出 字符 
宽度 ， 如 果 该 槽 对 应 的 format() 参 数 长 度 比 < 宽度 > 设 定 值 大 ， 则 使 用 参数 实际 长 度 ; 
如 果 该 值 的 实际 位 数 小 于 指定 宽度 ， 则 位 数 将 被 默认 以 空格 字符 补充 。< 对 齐 > 指 参 
数 在 宽度 内 输出 时 的 对 齐 方式 ， 分 别 使 用 <、> 和 2 3 个 符号 表示 左 对 齐 、 右 对 齐 和 
居中 对 齐 。< 填 充 > 指 宽度 内 除了 参数 外 的 字符 采用 什么 方式 表示 ， 默 认 采 用 空格 ， 
可 以 通过 填充 更 换 。 例 如 : 


格式 控制 标记 中 的 逗号 〈, ) 用 于 显示 数字 类 型 的 干 位 分 隔 符 ， 例 如 : 


<. 精 度 > 表 示 两 个 含义 ， 由 小 数 点 〈.) 开头 。 对 于 浮 点 数 ， 精 度 表示 小 数 部 分 
输出 的 有 效 位 数 。 对 于 字符 串 ， 精 度 表示 输出 的 最 大 长 度 。 


< 类 型 > 表示 输出 整数 和 浮 点 数 类 型 的 格式 规则 。 对 于 整数 类 型 ， 输 出 格式 包括 
以 下 6 种 。 

(1) b: 输出 整数 的 二 进 制 方式 。 

(2) c: 输出 整数 对 应 的 Unicode 字符 。 

(3) d: 输出 整数 的 十 进 制 方式 。 


:Python 字符 串 类 


小 测验 
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(4) o: 输出 整数 的 八进制 方式 。 
(5) x: 输出 整数 的 小 写 十 六 进 制 方式 。 
(6) X: 输出 整数 的 大 写 十 六 进 制 方式 。 


(1) e: 输出 浮 点 数 对 应 的 小 写字 母 e 的 指数 形式 。 
(2) E: 输出 浮 点 数 对 应 的 大 写字 母 E 的 指数 形式 。 
(3) f 输出 浮 点 数 的 标准 浮 点 形式 。 

(4) %: 输出 浮 点 数 的 百 分 形 式 。 

浮 点 数 输出 时 尽量 使 用 <. 精 度 > 表示 小 数 部 分 的 宽度 ， 有 助 于 更 好 控制 输出 格式 。 


和 字符 串 和 字 节 流 


' 进 制 角度 有 确定 的 长 度 和 存储 空间 。Python 字符 事由 编码 字符 的 序列 组 成 ,字符 ， 
! 根据 编码 不 同 长 度 也 不 相同 。 因 此 ， 从 存储 空间 角度 ， 字 符 串 和 字 节 流 不 相同 。 
， 硬盘 上 所 有 文件 都 以 字 节 形式 存储 ， 例 如 ， 文本、 图 片 及 视频 等 ,真正 存 储 
, 和 传输 数据 时 都 是 以 字 节 为 单位 。 字 符 值 在 内 存 中 形成 ， 由 字 节 流 经 过 编码 处 理 ， 
' 后 产 此 。 人 
思考 与 练习 

3.21 请 思考 并 描述 下 面 Python 语句 的 输出 结果 : 

print(" :>los} ul:<8,.2f}" tormati("Length™, 23.87501). 

3.22 ”格式 化 输出 389 的 二 进 制 、 八 进 制 、 十 进 制 、 十 六 进 制 的 表达 形式 ， 以 
及 对 应 的 Unicode 字符 。 

3.23 ”格式 化 输出 0.002 178 对 应 的 科学 表示 法 形式 , 保留 4 位 有 效 位 的 标准 浮 
点 形式 以 及 百 分 形 式 。 


3.7 ”实例 4: 文本 进度 条 


要 本 ;这 是 一 个 利用 格式 化 输出 和 时 间 延 迟 实现 控制 台风 格 文本 进度 条 的 ， 
实例 。 ) 


2 
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3.7.1 简单 的 开始 


进度 条 是 计算 机 处 理 任务 或 执行 软件 中 常用 的 增强 用 户 体验 的 重要 手段 ， 它 能 
够 实时 显示 任务 或 软件 的 执行 进度 。 本 节 将 利用 Python 字符 串 处 理 方法 实现 文本 进 
度 条 功能 。 

最 简单 地 ， 利 用 printO 函 数 实现 简单 的 非 刷新 文本 进度 条 。 基 本 思想 是 按照 任 
务 执行 百分比 将 整个 任务 划分 为 100 个 单位 ， 每 执行 N% 输 出 一 次 进度 条 。 每 一 行 
输出 包含 进度 百分比 ， 代 表 已 完成 的 部 分 (**) 和 未 完成 的 部 分 〈…) 的 两 种 字符 ， 
以 及 一 个 跟随 完成 度 前 进 的 小 第 头 ， 风 格 如 下 : 


和 IO [#kngw> 


由 于 程序 执行 速度 远 超过 人 眼 的 视觉 停留 时 间 ， 直 接 进行 字符 输出 几乎 是 瞬间 
完成 ， 不 利于 观察 。 为 了 模拟 任务 处 理 的 时 间 效 果 ， 调 用 Python 标准 时 间 库 time， 
使 用 time.sleep(b 函 数 将 当前 程序 暂时 挂 起 ts，t 可 以 是 小 数 。 由 此 可 以 接近 真实 的 
模拟 进度 条 效果 输出 。 使 用 import 保留 字 调 用 time 库 。 


| >>> import time E Ee 上 二 下 3 es aA 


默认 情况 ，printO 函 数 在 输出 结 吉 尾 处 会 自动 产 4 生 一 个 \n'"， 即 换行 符 ， 从 而 让 光 
标 自动 移动 到 下 一 行 行 首 ， 这 样 上 一 步 输出 依旧 保存 在 界面 上 。 

采用 for 循环 和 print0 函 数 构成 程序 的 主体 部 分 ， 输 出 百分比 最 高 (100%) 为 
3 位 数据 ， 为 了 使 输出 显得 整齐 ， 可 以 使 用 {:^3.0f} 格 式 化 百分比 部 分 。 这 个 简单 的 
文本 进度 条 代码 如 下 。 变 量 scale 表示 输出 进度 条 的 精度 ， 读 者 可 以 修改 这 个 值 观 
察 效果 变化 。 


实例 代码 4.1 e4.1TextProgressBar.py 
#e4.1TextProgress Bar.py 

2 import time 

3 scale = 10 

a |Print(t"-=-=-= 执行 开始 ------ 

5 for i in range (scale+1): 

6 a, b = xx' * i,'..' * (scale - i) 
. c= (i/scale)*100 

8 print("%{:3.0£}I{}=>{}]" .format (ce, a, Bb)) 
9 time. sleep (0.1) 

10 | 了 ED 世人 一 一 一 一 一 二 执行 结束 ------ ) 


源 代码 3-8 


Or 


某 本 的 多 行文 本 


刘 庆 条 


oO 
源 代码 3-9: 
单行 动态 刷新 
“和 
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3.7.2 ”单行 动态 刷新 


常用 的 计算 机 系统 中 都 有 进度 条 ， 这 些 进 度 条 一 般 只 在 一 行 中 改变 进度 比例 ， 
与 实例 代码 4.1 相 比 ， 区 别 在 于 原 地 输出 和 动态 刷新 ， 其 基本 思想 是 将 每 一 次 进度 
输出 都 固定 在 同一 行 ， 并 不 断 地 用 新 生成 的 字符 串 覆 盖 之 前 的 输出 ， 形 成 进度 条 不 
断 刷 新 的 动态 效果 。 这 种 效果 称 为 “单行 动态 刷新 ” 可 以 通过 print0 函 数 实现 。 

采用 printO 函 数 的 具体 方法 是 ， 在 printO 函 数 中 更 换 参 数 end 的 默认 值 为 "， 即 
每 次 使 用 print0 函 数 输出 时 不 换行 。 此 时 ， 系 统 输出 指针 还 停留 在 上 一 次 输出 的 行 
尾 ， 下 一 次 输出 在 字符 串 前 部 增加 转 义 符 \r， 该 转 义 符 把 输出 指针 移动 到 行 首 而 不 
换行 。 动 态 刷 新 一 个 百分比 的 完整 代码 如 下 : 


实例 代码 4.2 e4.2TextProgressBar. 


#e4.2TextProgressBar.py 

import time 

for i in range(101): 
Print("\r{:2}%".format (i), end="") 
time. sleep (0.05) 5 


Ne 


上 述 程 序 在 IDLE 中 的 执行 效果 如 下 。 
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为 什么 输出 没有 单行 刷新 呢 ? 这 是 因为 IDLE 本 身 屏蔽 了 单行 刷新 功能 ， 如 果 
希望 获得 刷新 效果 ， 请 使 用 控制 台 的 命令 行 执行 e4.2TextProgressBar.py 程序 。 以 
Windows 系统 为 例 , 启动 命令 行 工 具 (<Windows 系统 安装 目录 >\system32\cmd.exe )， 
选择 到 e4.2TextProgressBarpy 文件 所 在 目录 执行 如 下 命令 行 ， 执 行 完成 后 即 可 输出 
可 以 单行 刷新 且 快 速 变 化 的 百分比 。 


3.7.3 ” 带 刷 新 的 文本 进度 条 


将 前 两 小 节 的 程序 合并 ， 再 添加 开始 和 结束 提示 语 ， 可 以 很 好 地 实现 带 刷新 的 
文本 进度 条 。 为 了 进一步 提高 用 户 体验 ， 在 文本 进度 条 中 增加 运行 时 间 的 监控 ， 这 
里 采用 time 库 中 的 time.clockO 函 数 。time.clockO 函 数 一 般 多 次 出 现 ， 第 一 次 调用 时 
计时 开始 ， 同 一 程序 中 第 二 次 及 后 续 调用 时 返回 与 第 一 次 计时 之 间 的 时 间 差 ， 单 位 
为 秒 。 该 函数 主要 用 来 统计 程序 运行 时 间 ， 增 加 用 户 体验 。 文 本 进度 条 完整 代码 如 
下 : 


De 
实例 代码 4.3 e4.3TextProgressBar. 源 代码 3-10: | 
带 刷 新 的 文本 进 : 
1 #e4.3TextProgress Bar.py ES a 
有 2 import time 
3 scale = 50 
4 | print ("执行 开始 ". center (scale//2,'-')) 
5 t = time.clock () 
6 for i in range(scale+1): 
7 站 到 1E 二 开 
8 b= '.'* (scale - i) 
9 c= (i/scale)*100 
10 t -= time.clock() 
了 二 print("\r{:^3.0f}%[{}->{}]{:.2f}s" .format(c,a,b,-t),\ 
end="'') 
12 time.sleep(0.05) 


13 | print("\n"+" 执 行 结 束 " .center (scale//2,'-')) 


采用 命令 行 执 行 上 述 文 件 ， 效 果 如 下 : 
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丘 展 : 进度 条 设计 方法 


' 知 。 美 国 卡耐基 . 梅 隆 大 学 的 研究 人 员 做 了 进度 条 设计 和 人 类 心理 的 相关 研究 [4]。 


D 
E 
上 
0 
[0 
' 
4 
FE 


' 
f 
上 
f 
4 
上 
0 


该 研究 首先 列举 了 9 个 不 同 的 进度 条 设计 函数 ， 如 表 3513 所 示 ， 并 根据 这 些 
函数 的 实际 执行 进度 和 进度 条 的 显示 进度 进行 了 比较 ， 如 图 3.5 所 示 ， 可 以 看 出 ， 
这 些 函数 显示 实际 进度 的 方式 五 花 八 门 ， 各 有 各 的 特色 。 


表 3.13 ”进度 条 设计 函数 

设 计 名 称 设计 函数 
Es fo =x 
Early Pause f(x) = x+(1-sin(x*n*#2+n/2))/-8 
Late Pause f(x) = x+(1-sin(x*7*2+7/2))/8 
Slow Wavy f(x) = x+sin(x*n*5)/20 
Fast Wavy f(x) = x+sin(x*n*20)/80 
Power f(x) = (x+(1-x)*0.03) 
Inverse Power f(x) = 1+(1-x)™ *-1 
Fast Power f(x) = (x+(1-x)/2) 
Inverse Fast Power f(x) = 1+(1-x) *-1 


100% 


Inverse Fast Power. SN 


Late Pause 1 


Inverse Power 


进度 条 显示 进度 


Fast Power 


100% 
实际 执行 进度 


图 3.5 9 个 进度 条 设计 函数 的 显示 有 曲线 


~ 
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， 研究 人 员 进 一 步 根 据 这 些 函 数 进 行 了 心理 学 实验 ， 结 果 表 明 : 
(1) 用 户 可 以 容忍 最 初 的 慢 速 增长 。 
(2 ) 用 户 难以 容忍 在 进程 快要 结束 时 进度 条 突然 停滞 不 前 。 
上 述 研 究 实际 上 建议 在 设计 进度 条 时 ， 可 以 适当 降低 开始 阶段 的 进展 速度 ， 
然后 适当 加 快 未 尾 阶段 的 进展 过度 ， 这 样 的 调整 可 以 给 用 户 带 来 更 舒适 、“ 更 快 ” 


On sD 


思考 与 练习 

3.24 ”进度 条 反映 了 软件 的 执行 速度 ， 请 思考 并 给 出 至 少 3 种 提高 软件 执行 速 
度 的 方法 。 

3.25 ”str.center() 方 法 的 功能 是 什么 ? 

3.26 如果 将 Y 放 在 print0 中 字符 串 的 其 他 部 分 ， 会 产生 什么 效果 ? 


本 章 小 结 


本 章 首 先 介绍 了 计算 机 中 常用 的 数字 类 型 及 操作 , 包括 Python 内 置 的 数值 运算 
操作 和 数字 类 型 转换 函数 等 , 进一步 介绍 了 常用 的 数学 计算 标准 库 math 库 。 采 用 数 
学 计算 将 模糊 的 “好 好 学 习 ， 天 天 向 上 ”数据 化 ， 展 示 了 持续 性 学 习 的 强大 力量 。 
本 章 同 时 介绍 了 字符 串 类 型 及 其 操作 和 格式 化 方法 ， 并 通过 字符 串 格 式 化 实现 控制 
台风 格 的 文本 进度 条 。 


程序 练习 题 


3.1 重量 计算 。 月 球 上 物体 的 体重 是 在 地 球 上 的 16.5%， 假 如 你 在 地 球 上 每 年 
增长 0.5 kg， 编 写 程序 输出 未 来 10 年 你 在 地 球 和 月 球 上 的 体重 状况 。 

3.2 ”天 天 向 上 续 。 尽 管 每 天 坚持 ， 但 人 的 能 力 发 展 并 不 是 无 限 的 ， 它 符合 特定 
模型 。 假 设 能 力 增 长 符合 如 下 带 有 平台 期 的 模型 ; 以 7 天 为 周期 ， 连 续 学 习 3 天 能 
力 值 不 变 ， 从 第 4 天 开始 至 第 7 天 每 天 能 力 增长 为 前 一 天 的 1%。 如 果 7 天 中 有 1 
天 间断 学 习 ， 则 周期 从 头 计算 。 请 编写 程序 回答 ， 如 果 初 识 能 力 值 为 1， 连 续 学 习 
365 天 后 能 力 值 是 多 少 ? 

3.3 ”天 天 向 上 续 。 采 用 程序 练习 题 3.2 的 能 力 增长 模型 ， 如 果 初 始 能 力 值 为 1， 
固定 每 10 天 休息 1 天 ，365 天 后 能 力 值 是 多 少 ? 如果 每 15 天 休息 1 天 呢 ? 

3.4” 回 文 数 判 断 。 设 n 是 一 任意 自然 数 ， 如 果 n 的 各 位 数字 反 向 排列 所 得 自然 
数 与 相等 ， 则 n 被 称 为 回 文 数 。 从 键盘 输入 一 个 5 位 数字 ， 请 编写 程序 判断 这 个 
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数字 是 不 是 回 文 数 。 
3.5” 田 字 格 的 输出 。 使 用 print0 函 数 输出 如 图 3.6 所 示 样 式 的 田 字 格 。 


cmd.exe )。 运 行 该 程序 ， 观 察 输出 效果 。 更 改 print0 函 数 的 参数 ， 例 如 ， 去 掉 end 
的 赋值 ， 再 观察 运行 结果 。 


1 while True: 
2 for i in [A 5 "1 | VAN 到 | i 
3 Print("%s\r" gg 1 ,end = '') 


3.8 小 巧 而 精致 的 第 三 方 进度 条 工具 库 。tqdm 是 一 个 快速 、 扩 展 性 强 的 进度 条 
工具 库 。tqdm 是 一 个 第 三 方 库 ， 首 先 需 要 安装 ， 然 后 才能 使 用 。 本 书 8.6 节 将 详细 
介绍 第 三 方 库 的 安装 方法 。 请 读者 提前 参考 阅读 。 运 行 如 下 程序 ， 观 察 运行 结果 。 


程序 练习 题 代码 3.8 a3.8tqdmBar. 


#a3.8tqdmBar .py 

from tqdm import tqdm 

from time import sleep 

for i in tqdm(range(1,100)): 
sleep(0.01) 


(6 
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好 殉 作 fF 用 十 让 敌 灯 1 和 东 克 赣 起 类 其 削 。 

The function of good software is to make the complex appear to be simple. 
格雷 迪 : 布 奇 (Grady Booch) 
UML 和 Booch 方法 的 创始 人 


ET 


一 一 


(1) 了 解 程序 的 基本 结构 并 绘制 流程 图 。 | 
(2) 掌握 程序 的 分 支 结构 。 | 
(3) 运用 证 语句 实现 分 支 结构 。 
(4) 掌握 程序 的 循环 结构 。 
(5) 运用 for 语句 和 while 语句 实现 循环 结构 。 
(6) 掌握 随机 库 的 使 用 方法 。 
(7) 了 解 程 序 的 异常 处 理 及 用 法 。 


Vo 


2 


对 工 的 精确 求解 是 数学 历史 上 一 直 难 以 解决 的 问题 之 一 ， 古 希腊 大 数学 家 阿 基 
米 德 使 用 迭代 算法 和 两 侧 数值 逼近 的 概念 率先 求 出 r 小数点 后 6 位 精确 值 。 公 元 263 
年 ， 中 国 数学 家 刘 徽 用 “ 割 圆 术 ” 计 算 圆 周 率 ,“ 割 之 弥 细 ， 所 失 弥 少 ， 割 之 又 割 ， 
以 至 于 不 可 制 , 则 与 圆周 合体 而 无 所 失 矣 。”% 这 其 中 蕴含 了 求 极 限 的 创新 思想 。2015 
年 ， 罗 切 斯 特大 学 的 科学 家 们 在 氧 原子 能 级 的 量子 力学 计算 中 发 现 了 圆周 率 相同 的 
公式 。 


对 于 这 个 神秘 的 数字 ， 用 编程 语言 能 获得 什么 新 的 认识 呢 ? 
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4.1 程序 的 基本 结构 


一 


二 一 一 一 


4.1.1 程序 流程 图 


程序 流程 图 用 一 系列 图 形 、 流 程 线 和 文字 说 明 描 述 程序 的 基本 操作 和 控制 流程 ， 
它 是 程序 分 析 和 过 程 描述 的 最 基本 方式 。 流程 图 的 基本 元 素 包括 7 种 , 如 图 4.1 所 示 。 


| 


(a) 起 止 框 (b) 判断 框 (0) 处 理 框 “”(d) 输入 /输出 框 


| 


(e) 注释 框 (f) 流向 线 。 ”(g) 连接 点 
图 4.1 程序 流程 图 的 7 种 元 素 


其 中 ， 起 止 框 表示 一 个 程序 的 开始 和 结束 ;判断 框 判断 一 个 条 件 是 否 成 立 ， 并 
根据 判断 结果 选择 不 同 的 执行 路 径 ; 处 理 框 表示 一 组 处 理 过 程 ; 输入 /输出 框 表示 数 
据 输入 或 结果 输出 ， 注 释 框 增加 程序 的 解释 ， 流 向 线 以 带 箭头 直线 或 曲线 形式 指示 
程序 的 执行 路 径 ， 连接 点 将 多 个 流程 图 连接 到 一 起 ， 常 用 于 将 一 个 较 大 流程 图 分 隔 
为 若干 部 分 。 图 4.2 所 示 为 一 个 流程 图 示例 ， 为 了 便于 描述 ， 采 用 连接 点 A 将 流程 
图 分 成 两 个 部 分 。 


图 4.2 程序 流程 图 示例 由 连接 点 A 连接 的 一 个 程序 
4.1.2 程序 的 基本 结构 


目前 为 止 ， 计算 机 程序 可 以 看 作 是 一 条 一 条 顺序 执行 的 代码 。 顺 序 结构 是 程序 
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的 基础 ， 但 单一 的 顺序 结构 不 可 能 解决 所 有 问题 ， 因 此 需要 引入 控制 结构 来 更 改 程 
序 的 执行 顺序 以 满足 多 样 的 功能 需求 。 

程序 由 3 种 基本 结构 组 成 : 顺序 结构 、 分 支 结构 和 循环 结构 。 这 些 基本 结构 都 
有 一 个 入 口 和 一 个 出 口 。 任 何 程序 都 由 这 3 种 基本 结构 组 合 而 成 。 为 了 直观 展示 程 
序 结构 ， 这 里 采用 流程 图 方式 描述 。 

顺序 结构 是 程序 按照 线性 顺序 依次 执行 的 一 种 运行 方式 ， 如 图 4.3 所 示 ， 其 中 
语句 块 1 和 语句 块 2 表示 一 个 或 一 组 顺序 执行 的 语句 。 

分 支 结构 是 程序 根据 条 件 判断 结果 而 选择 不 同 向 前 执行 路 径 的 一 种 运行 方式 ， 
如 图 4.4 所 示 ， 根 据 分 支 路 径 上 的 完备 性 ， 分 支 结构 包括 单 分 支 结构 和 二 分 支 结构 ， 
二 分 支 结 构 组 合 形成 多 分 支 结构 。 


| R | 
I 
| a 
1 (a) 单 分 支 结构 (b) 二 分 支 结构 
图 4.3 顺序 结构 的 流程 图 表示 图 4.4 分 支 结构 的 流程 图 表示 


循环 结构 是 程序 根据 条 件 判断 结果 向 后 反复 执行 的 一 种 运行 方式 ， 如 图 4.5 所 
示 ， 根 据 循环 体 触 发 条 件 不 同 ， 循 环 结构 包括 条 件 循环 和 人 遍历 循环 结构 。 


i 
有 Ee 
是 元 素 
否 
遍历 结束 
了 
(a) 条 件 循环 (b) 遍历 循环 


图 4.5 循环 结构 的 流程 图 表示 
4.1.3 程序 的 基本 结构 实例 


对 于 一 个 计算 问题 ， 可 以 用 IPO、 流 程 图 或 者 直接 以 Python 代码 方式 描述 。 本 
书 仅 对 这 几 种 描述 进行 介绍 ， 功 能 简单 的 问题 建议 读者 直接 编写 Python 代码 ,功能 
复杂 的 问题 可 以 采用 IPO 描述 或 流程 图 描述 为 手段 。 下 面 给 出 3 个 微 实例 ， 通 过 不 
同 的 描述 方法 具体 解释 程序 的 3 种 基本 结构 。 

【 微 实例 4.1】 圆 面积 和 周 长 的 计算 。 

根据 圆 的 半径 计算 圆 的 面积 和 周 长 。 图 4.6 分 别 给 出 了 该 问题 的 IPO 描述 、 流 
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程 图 描述 和 Python 代码 描述 。 


输入 : 加 半径 R WeRYR=S 1 | R=evalinputo" 请 输入 圆 半径 :9) 
处 理 : 2 | S=3.1415*R#R 

圆 面积 ，S= rs*R*R i de 3 | L=2#3.1415#*R 

圆周 长 : L=2*x*R 4 | print(" 面 积 和 周 长 :",S:ID) 


输出 :加 面积 S、 周 长 L 
(结束 ) 


(a) 问题 IPO 描 述 (b) 流程 图 描述 (5) Python 代码 描述 


图 4.6 顺序 结构 在 三 种 描述 下 的 对 比 


据 展 于 程序 的 描述 方式 

” ”程序 的 描述 方式 主要 有 3 类 ， 分 别 是 自然 语言 、 流 程 图 和 伪 代 码 。 
: 自然 语言 描述 方式 指使 用 人 类 语言 直接 描述 程序 ，IPO 描述 是 其 中 一 种 . 优 ， 
; 点 是 灵活 自然 ， 缺 点 是 容易 出 现 二 义 性 ， 即 一 个 描述 可 以 产生 多 种 不 同 的 程序 ; 
' 代码 。 ] 
， ”流程 图 描述 是 程序 最 直观 易 懂 的 表达 方式 ， 主 要 适用 于 较 短 的 算法 。 优 点 是 ， 
' 直观 、 清 晰 且 远 辑 确定 ， 缺 点 是 流程 图 绘制 比较 烦 瑛 ， 当 程序 较 大 时 流程 图 会 很 ， 
! 复杂 ， 反 而 降低 了 表达 的 清晰 性 。 | 
， ， 伪 代码 是 介 于 自然 语言 与 编程 语言 之 间 的 一 种 算法 描述 语言 。 使 用 伪 代 码 不 ! 
' 用 拘泥 于 具体 编程 语言 ， 对 整个 算法 运行 过 程 的 描述 最 接近 自然 语言 。 与 自然 语 ; 
' 言 描述 不 同 , 伪 代 码 在 保持 程序 结构 的 情况 下 描述 算法 。 由 于 Python 语言 语法 相 ， 
:对 简单 ， 本 书 没有 采用 伪 代 码 方式 描述 程序 . 


【 微 实例 4.2】 实 数 绝对 值 的 计算 。 

计算 用 户 给 定 实数 的 绝对 值 。 图 4.7 分 别 给 出 了 该 计算 问题 的 IPO 描述 、 流 程 
图 描述 和 Python 代码 描述 。 

【 微 实例 4.3】 整 数 累 加 。 

计算 1 到 正 整 数 R 的 算术 和 。 图 4.8 分 别 给 出 了 该 计算 问题 的 IPO 描述 、 流 程 
图 描述 和 Python 代码 描述 。 

IPO 描述 、 流 程 图 描述 和 Python 代码 描述 是 解决 计算 问题 的 3 种 描述 方式 ， 细 
致 程 度 逐 步 递 进 。IPO 描述 主要 用 于 区 分 程序 的 输入 输出 关系 , 重点 在 于 结构 划分 ， 
算法 主要 采用 自然 语言 描述 。 流 程 图 描述 侧重 于 描述 算法 的 具体 流程 关系 ,流程 图 
的 结构 化 关系 相 比 自然 语言 描述 更 进一步 , 有 助 于 阅 述 算法 的 具体 操作 过 程 。 Python 
代码 描述 是 最 终 的 程序 产 出 ， 最 为 细致 。 


所 
SS 
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输入 : 实数 R 1 ”R=eval(input(" 输 入 实数 :")) 
处 理 : 2 | if(R<O0): 
RI= { RR>0 3 R=-R 
ed 4 | print(" 绝 对 值 ",R) 
输出 : 输出 |RI 
(a) 问题 IPO 描 述 (b) 流程 图 描述 (c) Python 代码 描述 
图 4.7 分 支 结 构 在 三 种 描述 下 的 对 比 
输入 : 正 整数 R R= eval(input(" 请 输入 正 整 数 :")) 
处 理 : 2 i,S=0,0 
S=1+243+-… 十 民 3 | while (i<=R): 
输出 : 输出 S 4 S=S+i 
5 i=i+1 
6 print(" 涌 加 求 和 ".S) 
(a) 问题 IPO 描 述 (b) 流程 图 描述 (c) Python 代码 描述 
图 4.8 循环 结构 在 三 种 描述 下 的 对 比 
思考 与 练习 


4.1 判断 题 : 复杂 的 程序 结构 都 是 由 基本 结构 组 合 而 成 。 
4.2 判断 题 : 分 支 结构 可 以 向 已 经 执行 过 的 语句 部 分 跳 转 〈 即 向 后 跳 转 )。 
4.3 下 面 是 流程 图 的 基本 元 素 的 是 (  )。 

A. 判断 框 B. 顺序 结构 C. 分 支 结 构 D. 循环 结构 
4.4 循环 结构 可 以 使 用 Python 语言 中 的 ( ) 语句 实现 ? 

A. print B. while C. loop DBD 证 
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要 点 : Python 通过 认 elif、else 等 保留 字 提 供 单 分 支 、 二 分 支 和 多 分 支 结构 。 


4.2.1 单 分 支 结构 : 让 语句 


Python 中 让 语句 的 语法 格式 如 下 : 
if < 条 件 >: 
< 语句 块 > 
语句 块 是 证 条 件 满足 后 执行 的 一 个 或 多 个 语句 序列 , 语句 块 中 语句 通过 与 让 所 
在 行 形成 缩 进 表 达 包 含 关系 。f 语 句 首 先 评估 条 件 的 结果 值 ， 如 果 结 果 为 True， 则 
执行 语句 块 中 的 语句 序列 ， 然 后 控制 转向 程序 的 下 一 条 语句 。 如 果 结 果 为 False， 语 
句 块 中 的 语句 会 被 跳 过 。 计 语句 的 控制 过 程 如 图 4.9 所 示 。 


图 4.9 评语 名 的 控制 流程 图 


if 语句 中 语句 块 执行 与 否 依赖 于 条 件 判 断 。 但 无 论 什 么 情况 ， 控 制 都 会 转 到 让 
语句 后 与 该 语句 同 级 别 的 下 一 条 语句 。 
站 语句 中 条 件 部 分 可 以 使 用 任何 能 够 产生 True 或 False 的 语句 或 函数 。 形 成 判 
断 条 件 最 常见 的 方式 是 采用 关系 操作 符 。Python 语言 共有 6 个 关系 操作 符 , 如 表 4.1 
所 示 。 
表 4.1 Python 的 关系 操作 符 ( 共 6 个 ) 
操 作 符 操作 符 含义 
小 于 
小 于 或 等 于 
= 大 于 或 等 于 
| 等 于 
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特别 注意 ，Python 使 用 “=” 表 示 赋 值 语句 ， 使 用 “一 ”表示 等 于 。 
人 上 4.4】PM 2.5 空气 质量 提醒 (1)。 
气 污染 是 当下 社会 比较 关注 的 问题 ，PM2.5 是 衡量 空气 污染 的 重要 指标 。 
PM2.5 ae 2.5 pm 的 可 入 肺 颗 粒 物 。PM2.5 颗粒 粒 径 小 ， 含 
大 量 有 毒 、 有 害 物质 且 在 大 气 中 停留 时 间 长 、 输 送 距 离 远 ， 因 而 对 人 体 健康 和 大 气 
环境 质量 有 很 大 影响 。 目 前 空气 质量 等 级 以 PM2.5 数值 划分 为 6 级 。PM2.5 数值 在 
0 一 35 空气 质量 为 优 ，35 一 75 为 良 ，75 一 115 为 轻 度 污 染 ，115 一 150 为 中 度 污 染 ， 
150 一 250 为 重度 污染 ，250 一 500 为 严重 污染 。 
一 个 简化 版 的 空气 质量 标准 采用 三 级 模式 : 0 一 35 为 优 ，35 一 75 为 良 ，75 以 上 
为 污染 。 人 们 也 许 不 关心 PM2.5 指数 值 具体 为 多 少 ， 而 更 关心 空气 质量 到 底 怎样 。 
计算 机 可 以 通过 PM2.5 指数 分 级 发 布 空气 质量 提醒 。 该 问题 的 IPO 描述 如 下 。 
输入 : 接收 外 部 输入 的 PM2.5 值 
处 理 : 
ifPM2.5 值 > 75， 打 印 空气 污染 警告 
让 35< PM2.5 值 <75， 打 印 空气 质量 良 ， 建 议 适 度 户 外 运动 
站 PM2.5 值 <3$， 打 印 空气 质量 优 ， 建 议 户 外 运动 
输出 : 打印 空气 质量 提醒 
微 实 例 4.4 的 完整 代码 如 下 : 


微 实例 4.4 


Ban, 
PM 2.5 空气 质量 


m4.4PM25Warning. 


PM = eval (input ("请 输入 PM2 .5 数值 : ")) 
if 0<= PM < 35: 
print ("空气 优质 ， 快 去 户外 运动 !1") 
if 35 <= PM <75: 
print ("空气 良好 ， 适 度 户外 活动 ! ") 
if 75 <= PM: 
Print ("空气 污染 ， 请 小 心 ! ") 


OO OOD PP 


微 实例 4.4 展示 了 用 数字 进行 条 件 比较 的 例子 ， 字 符 或 字符 串 也 可 以 用 于 条 件 


比较 。 字 符 嘛 比较 本 质 上 是 字符 串 对 应 Unicode 编码 的 比较 ， 因 此 ， 字 符 串 的 比较 
按照 字典 顺序 进行 。 例如 ， 英文 大 写字 符 对 应 的 Unicode 编码 比 小 写字 符 小 。 以 下 
是 一 些 例子 : 
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4.2.2 ”二 分 支 结构 : if-else 语句 


Python 中 if-else 语句 用 来 形成 二 分 支 结构 ， 语 法 格式 如 下 : 
if < 条 件 >: 
< 语句 块 1> 
else: 
< 语句 块 2> 
语句 块 1 是 在 让 条 件 满足 后 执行 的 一 个 或 多 个 语句 序列 ,语句 块 2 是 让 条 件 不 
满足 后 执行 的 语句 序列 。 二 分 支 语句 用 于 区 分 条 件 的 两 种 可 能 ， 即 True 或 者 False， 
分 别 形成 执行 路 径 。 
【 微 实例 4.5】PM 2.5 空气 质量 提醒 (2)。 
如 果 用 户 只 关心 空气 质量 是 否 污染 两 种 情况 ， 可 以 通过 二 分 支 语 句 完成 。 


微 实例 4.5 m4.5PM25Warning.py 


PM = eval (input ("请 输入 PM2 .5 数值: ")) 
if PM >= 75: 

print ("空气 存在 污染 ， 请 小 心 ! ") 
else: 


print ("空气 没有 污染 ， 可 以 开展 户外 运动 1") 


ob WwW NP 


ied Oo 


es 二 分 支 结构 还 有 一 种 更 简洁 的 表达 方式 ， 适 合 通 过 判断 返回 特定 值 ， 语 法 格式 
| 提醒 (2) 如 下 : 
2 Se 


其 中 ， 表 达 式 1/2 一 般 是 数字 类 型 或 字符 串 类 型 的 一 个 值 ， 微 实例 4.5 可 以 改 


1 PM = eval (input ("请 输入 PEM2 .5 数值 : ") ) 
党 Print ("空气 {} 污 染 !" .format ("存在 " if PM >= 75 else "没有 ")) 


if-else 的 紧凑 结构 非常 适合 对 特殊 值 处 理 的 情况 ， 其 他 例子 如 下 : 


AT 大 司 
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个 人 中 一 个 人 说 真 话 ， 二 下 大玉 顺 呈 。 er 由 
你 该 怎样 问 才能 确 定 通 往 天 堂 的 大 门 呢 ? 


EE 


本 本 下 


4.2.3 多 分 支 结 构 : if-elif-else 语句 


Python 的 if-elif-else 描述 多 分 支 结 构 , 语句 格式 如 下 , 控制 流程 图 如 图 4.10 所 示 。 
if < 条 件 1>: 

< 语句 块 1> 
elif < 条 件 2>: 

< 语句 块 2> 


else: 
< 语句 块 N> 


图 4.10 多 分 支 结构 的 控制 流程 图 


多 分 支 结构 是 二 分 支 结构 的 扩展 ， 这 种 形式 通常 用 于 设置 同一 个 判断 条 件 的 多 

条 执行 路 径 。 Python 依次 评估 寻找 第 一 个 结果 为 True 的 条 件 , 执行 该 条 件 下 的 语句 

块 ， 结 束 后 跳 过 整个 if-elif-else 结构 ， 执 行 后 面 的 语句 。 如 果 没 有 任何 条 件 成 立 ， 

else 下 面 的 语句 块 将 被 执行 。else 子 句 是 可 选 的 。 
微 实例 4.4 通过 多 条 独立 的 这 语 句 对 同一 个 变量 PM 进行 判断 ， 这 种 情况 更 适 。 源 人 玛 4 


PM 2.5 空气 质量 ; 


合 多 分 支 结构 ， 改 造 后 的 代码 如 下 ; 提醒 ( 3 ) 


PM = eval (input ("请 输入 PM2 .5 数值 : ")) 
IE 0<= PM < 35: 

Print ("空气 优质 ， 快 去 户外 运动 !1") 
elif 35 <= PM <75: 

Print ("空气 良好 ， 适 度 户 外 活动 !") 


nn 必 mW 站 靖 
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6 else: 
7 print ("空气 污染 ， 请 小 心 ! ") 
思考 与 练习 


4.5 判断 题 : 简单 分 支 结 构 是 最 基础 的 程序 结构 ， 在 设计 中 一 般 用 不 到 。 
4.6 判断 题 : 多 分 支 结构 是 使 用 最 广泛 的 结构 ， 可 替代 任何 选择 性 结构 。 
4.7 判断 题 ， Python 作证 SU 
4.8 Python 通过 CN ) 来 判断 操作 是 否 在 分 支 结构 中 。 
A. 括号 了  B. 缩 进 C. 花 括号 D. 冒号 
4.9 ”请 分 析 下 面 的 程序 ， 若 输入 score 为 80， 输 出 grade 为 多 少 ? 是 否 符合 罗 


辑 ? 为 什么 ? 所 和 SA. 


2 
if score >= 60.0: 
grade = 'D’ 
elif score >= 70.0: 
grade = ‘C!’ 
elif score >= 80.0: 
Grade = 'B’ 


else score >= 90.0: 


J oO 上 WW ND 情 


Grade = ‘A’ 


4.3 实例 5: 身体 质量 指数 BMI 


~ 


v=oaseeeo rd 


改革 开放 近 40 年 ， 中 国 取得 了 世界 瞩目 的 发 展 成 就 ， 人 民生 活水 平 显 著 提高 ， 
越 来 越 多 人 开始 关注 “身体 质量 ”， 其 中 ， 肥 胖 程 度 最 受 关注 。 身 体质 量 指数 (Body 
Mass Index，BMI) 是 国际 上 常用 的 衡量 人 体 肥 胖 程度 和 是 否 健康 的 重要 标准 ， 主 
要 用 于 统计 分 析 。 肥 胖 程度 的 判断 不 能 采用 体重 的 绝对 值 ， 它 天 然 与 身高 有 关 。 因 
此 ，BMI 通过 人 体 体 重 和 身高 两 个 数值 获得 相对 客观 的 参数 ， 并 用 这 个 参数 所 处 范 
围 衡 量 身体 质量 。 

BMI 的 定义 如 下 : 

BMI= 体重 (kg) /身高 ? (m2?) 

例如 ， 一 个 人 身高 1.75 m、 体 重 75 kg， 他 的 BMI 值 为 24.49。 

BMI 值 可 以 客观 地 衡量 人 的 肥胖 程度 或 健康 程度 。 世界 卫生 组 织 (World Health 
Organization，WHO) 根据 全 球 人 口 体重 统计 认为 ，BMI 值 低 于 18.5 kg/m? 时 “过 
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轻 ” 表明 个 体 可 能 营养 不 良 或 者 饮食 无 法 保障 ，BMI 值 高 于 25 kg/m 时 “过 重 ”。 
我 国 卫生 部 也 根据 中 国人 体质 给 出 了 国内 BMI 参考 值 。 更 多 BMI 衡量 标准 如 表 4.2 
所 示 。 


表 4.2 BMI 指标 分 类 
< 18:5 
18.5 ~ 25 
25~30 
>30 


国内 BMI 值 (kg/m?) 
<18.5 
18.5 ~ 24 


拓展 :| 中 国 居民 腾 食 指南 
《中 国 居民 腾 食 指南 (2016)》 是 2016 年 5 月 13 日 由 国家 卫生 计生 委 疾 控 局 
' 发 布 的 指导 中 国 居 民 饮 食 的 权威 资料 。 该 指南 针对 2 岁 以 上 的 所 有 健康 人 群 提出 
| 6 条 核心 推荐 ， 分 别 为 : 食物 多 样 ， 谷 类 为 主 ; 吃 动 平衡 ， 健 康 体重 ; 多 吃水 果 、 
' 奶 类 、 大 豆 ; 适量 吃 鱼 、 禽 、 蛋 、 瘦 和 肉 ; 少 盐 少 油 ， 控 糖 限 酒 ; 杜绝 浪费 ， 新 兴 
, 食 尚 

指南 建议 平均 每 天 摄 入 12 种 以 上 食物 ， 每 周 25 种 以 上 。 各 年 龄 段 人 群 都 应 ， 
; 坚持 日 常 身体 活动 ， 每 周至 少 进行 5 天 中 等 强度 身体 活动 ， 累 计 150 分 钟 以 上 。 ; 
' 蔬菜 水 果 是 平衡 膳食 的 重要 组 成 部 分 ， 吃 各 种 各 样 的 奶 制品 ， 经 常 吃 豆 制品 ， 适 ; 
' 量 吃 坚果 。 和 鱼 、 禽 、 蛋 和 瘦 肉 摄 入 要 适量 。 少 吃 肥 肉 、 烟 下 和 腌 制 肉食 品 。 "3 
' 每 天 食盐 不 超过 6 g， 每 天 烹调 油 25~30g。 足 量 饮 水 ， 成 年 人 每 天 7~8 杯 ， 约 
' 1500 ~ 1700 ml， 提 倡 饮 用 白开水 和 茶水 。 健康 饮 食 ， 你 做 到 了 哪些 ? | 


本 实例 编号 一 个 根据 体重 和 身高 计算 BMI 值 的 程序 ， 同 时 输出 国际 和 国内 的 
BMI 指标 建议 值 。 该 问题 的 IPO 描述 如 下 。 

输入 : 身高 和 体重 值 

处 理 : 计算 BMI 值 ， 并 根据 BMI 指标 分 类 找到 合适 类 别 

输出 : 打印 指标 分 类 信息 

该 实例 的 完整 代码 如 下 ， 请 注意 各 判断 条 件 及 后 面 的 注释 。 其 中 第 2 行 最 后 采 
用 反 斜 枉 〈\) 将 很 长 的 一 行 分 解 为 两 行书 写 ， 对 于 Python 解释 来 说 ， 这 是 一 行 代码 。 


_ 实 例 代 码 5.1 e5.1CalBMI.py 

1 | #e5.1CalBMI .py wh 6 

2 | height, weight = eval (ingut(' ' 请 输入 身高 ( 米 ) 和 体重 \ 
| (公斤 ) [逗号 隔 开 ] : ")) 
| bmi = weight / Pow (height，2) 

Print ("BMI 数值 为 : {: .2f}".format (bmi) ) 

who Gom = 
| if bmi < 18.5:  # WHO 标准 

who = " 偏 瘦 " 


说 OO 性 WwW 


源 代码 4 4 
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8 |elif bmi < 25: # 18.5 <= bmi < 25 
9 who = "正常 " 

10 | elif bmi < 30: # 25 <= bmi < 30 
11 who = " 偏 胖 " 

12 else : 

13 who = "肥胖 " 

14 | if bmi < 18.5:  # 我 国 卫生 部 标准 

15 dom = " 偏 瘦 " 

16 | elif bmi < 24: # 18.5 <= bmi < 24 


17 dom = "正常 " 

18 | elif bmi < 28: #24 <= bmi < 28 
19 dom = " 偏 胖 " 

20 | else: 

21 dom = "肥胖 " 


22 | print ("BMI 指标 为 :国际 ' {0}'， 国 内 ' {1}'".format (wto,，dom)) 


程序 执行 后 的 效果 如 下 : 


实例 代码 5.1 采用 了 多 分 支 结构 对 BMI 数值 按照 不 同 区 间 范 围 进行 分 类 ， 这 种 
采用 证 elif-else 分 支 语句 进行 程序 设计 的 方式 十 分 常见 。 对 于 需要 同时 打印 国际 和 
内 两 套 BMI 标准 , 程序 采用 两 个 if-elif-else 语句 分 别 计算 两 类 不 同 BMI 值 。 这 种 
做 法 的 好 处 是 代码 清晰 明了 , 容易 调试 ,实例 代码 5.2 将 两 套 指标 合成 一 个 if-elif-else 


语句 实现 。 
站 源 代 码 4-5 实例 代码 5.2 e5.2CalBMI.py 
:身体 质量 指数 
BMI 的 计算 ( 2 ) 1 | #e5.2CalBMI.PY 


2 | height，weight = eval(input(" 请 输入 身高 ( 米 ) 和 体重 \ 
(公斤 ) [逗号 隔 开 ] : ") ) 

3 bmi = weight / Pow(height，2) 

4 | print ("BMI 数值 为 : {:.2f}".format (bmi)) 

5 who, dom = ""，"" 

6 |if bmi < 18.5: 

5 

8 

9 


who，dom = " 偏 瘦 " ，" 偏 瘦 " 
elif 18.5 <= bmi < 24: 
who，dom = "正常 "，" 正 常 " 
10 | elif 24 <= bmi < 25: 
和 who，dom = "正常 ",，" 偏 胖 " 
12 | elif 25 <= bmi < 28: 
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13 who，dom = " 偏 胖 " ，" 偏 胖 " 
14 | elif 28 <= bmi < 30: 


15 who, dom = " 偏 胖 " ， "肥胖 " 
16 | else: 
也 who，dom = "肥胖 "，" 肥 胖 " 


18 | Print("BMI 指标 为 :国际 '{0}'， 国 内 ' {1}'".format (who, dom)) 


比较 实例 代码 5.1 和 实例 代码 5.2 可 以 看 到 , 站 语句 的 运用 主要 与 程序 编写 者 对 
问题 的 理解 及 算法 设计 有 关 , 采用 一 组 让 语句 将 两 套 BMI 指标 融合 在 一 起 , 这 实际 
上 是 算法 的 改变 。 即 使 对 专业 程序 员 来 说 ， 程 序 的 简洁 性 和 可 读 性 都 比 更 少 的 代码 
行 数 重要 ， 这 里 ， 推 荐 采用 实例 代码 5.1 的 方式 编写 程序 。 


思考 与 练习 

4.10 观察 实例 代码 5.1 中 的 第 8 行 和 第 10 行 ， 思 考 为 何 代 码 不 按照 注释 方式 
写 全 变量 的 最 小 边界 。 

4.11 判断 题 : Python 中 条 件 24 <= 28 < 25 是 合法 的 ， 且 输出 为 False。 

4.12 ”实例 代码 5.1 中 第 2 行 最 后 的 反 斜 杠 (\) 有 什么 作用 ? 


4.4 程序 的 循环 结构 


PE 


”加 本 Python 通过 for、while 等 保留 守 提供 过 历 从 环 和 无 限 秆 环 的 结构 。 


VE 过 


根据 循环 执行 次 数 的 确定 性 ， 循 环 可 以 分 为 确定 次 数 循环 和 非 确定 次 数 循环 。 
确定 次 数 循环 指 循环 体 对 循环 次 数 有 明确 的 定义 ， 这 类 循环 在 Python 中 被 称 为 “ 遍 
历 循环 ”， 其 中 ， 循 环 次 数 采用 电 历 结构 中 的 元 素 个 数 来 体现 ， 具 体 采 用 for 语句 实 
现 。 非 确定 次 数 循环 指 程序 不 确定 循环 体 可 能 的 执行 次 数 ， 而 通过 条 件 判 断 是 否 继 
续 执 行 循环 体 ，Python 提供 了 根据 判断 条 件 执行 程序 的 无 限 循环 ， 采 用 while 语句 


4.4.1 遍历 循环 : for 语句 


Python 通过 保留 字 for 实现 “遍历 循环 ”基本 使 用 方法 如 下 : 
for < 循环 变量 > in < 遍历 结构 >: 
< 语句 块 > 
之 所 以 称 为 “遍历 循环 ” 是 因为 for 语句 的 循环 执行 次 数 是 根据 遍历 结构 中 元 
素 个 数 确定 的 。 遍历 循环 可 以 理解 为 从 遍历 结构 币 逐 一 提取 元 素 ， 环 变 
对 于 所 提取 的 每 个 元 素 执行 一 次 语句 块 。 


1 入 
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遍历 结构 可 以 是 字符 串 、 文 件 、 组 合 数据 类 型 或 range() 函 数 等 ， 常 用 的 使 用 方 


式 如 下 一 Ps 
循环 w 次 ) 遍历 文件 £1 HK 人 于 人) 记 历 列 作 1s ) 
Fox Tn range (N) : foxr lirne in fi: Ea e EN for item in ls: 
< 语句 块 > < 语句 块 > < 语句 块 > < 语句 块 > 
遍历 循环 还 有 一 种 扩展 模式 ， 使 用 方法 如 下 : 
for < 循环 变量 > in < 遍历 结构 >: 
< 语句 块 1> 
else: 
< 语句 块 2> 
在 这 种 扩展 模式 中 ， 当 for 循环 正常 执行 之 后 ， 程 序 会 继续 执行 else 语句 中 的 
内 容 。else 语句 只 在 循环 正常 执行 并 结束 后 才 执 行 ， 因 此 ， 可 以 在 < 语句 块 2> 中 放 
置 判 断 循环 执行 情况 的 语句 。4.4.3 节 将 结合 continue 和 break 语句 进一步 讲解 for 
语句 中 else 的 用 法 。 这 里 先 给 出 一 个 小 例子 : 


1 for s 出 "BIT'": 

2 print ("循环 进行 中 : ”+ s) 
3 else: 

4 s = "循环 正常 结束 " 

5 Print(s) 


程序 执行 后 的 结果 如 下 : 


4.4.2 无 限 循环 : while 语句 


很 多 应 用 无 法 在 执行 之 初 确定 遍历 结构 ， 这 需要 编程 语言 提供 根据 条 件 进 行 循 
环 的 语法 ， 称 为 无 限 循 环 ， 又 称 条 件 循 环 。 无 限 循环 一 直 保 持 循环 操作 直到 循环 条 
件 不 满足 才 结 束 ， 不 需要 提前 确定 循环 次 数 。 

Python 通过 保留 字 while 实现 无 限 循环 ， 基 本 使 用 方法 如 下 : 

while < 条 件 >: 

< 语句 块 > 

其 中 条 件 与 让 语句 中 的 判断 条 件 一 样 ， 结 果 为 True 和 False。 

while 语义 很 简单 ， 当 条 件 判 断 为 True 时 ， 循 环 体重 复 执行 语句 块 中 语句 ; 当 
条 件 为 False 时 ， 循 环 终止 ， 执 行 与 while 同 级 别 缩 进 的 后 续 语 句 。 

无 限 循环 也 有 一 种 使 用 保留 字 else 的 扩展 模式 ， 使 用 方法 如 下 : 
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while < 条 件 >: 
< 语句 块 1> 
else: 
< 语句 块 2> 
在 这 种 扩展 模式 中 ， 当 while 循环 正常 执行 后 ， 程 序 会 继续 执行 else 语句 中 的 
内 容 。else 语句 只 在 循环 正常 执行 后 才 执 行 ， 因 此 ， 可 以 在 语句 块 ? pr pe 


环 执行 情况 的 语句 ， 例 如 : 1 第 .uwT{ -9 i 


E s, idx = "BIT", 0 

2 while idx < len(s): 
3 print ("循环 进行 中 : " + s[idx]) 
4 idx += 1 
5 else: 

6 = "循环 正常 结束 " 
人 Print(s) 


程序 执行 后 的 结果 如 下 : 


如 果 通 过 while 实现 一 个 计数 循环 ， 需 要 在 循环 之 前 对 计数 器 idx 进行 初始 化 , 
并 在 每 次 循环 中 对 计数 器 idx 进行 暴 加 ,如 上 述 代码 第 4 行 。 对 比 一 下 ,在 for 循环 
中 循环 变量 逐一 取 自 遍 历 结 构 ， 不 需要 程序 维护 计数 器 。 


厂 砚 明科 幻 电影 中 的 循环 故事 


A- 


六、 


{ 循环 不 仅 是 编程 语言 的 组 成 部 分 , 也 是 好 菜 坞 科幻 题材 的 最 爱 。 在 编剧 笔下 ，， 
le en 空间 碟 实 中 无 限 循环 ， 剧 情 展示 着 主人 公 宣 受 并 发 现 循环 奥秘 ， 
; 的 历程 ， 十 分 刺激 好 看 ! 下 面 推荐 几 部 无 限 循环 类 电影 ， 感 受 一 下 控制 结构 的 奥 ， 
; 秘 吧 ! 例如 ， Gn 《 源 代码 小 《 吉 蝶 效应 水 《 罗 拉 快 跑 人 I 边缘 》、 
\《 土 拔 鼠 之 日 》 等 。 Wr 


“一 一 一 一 一 -一 一 一 一 一 一 一 一 一 一 一 一 一 ~ 一 一 ~ 一 ~ 一 一 一 一 一 一 一 二 一 二 二 一 二 一 一 一 一 一 一 = 二 一 一 一 一 一 一 一 二 一 -一 一 一 -一 


4.4.3 循环 保留 字 : break 和 continue 


循环 结构 有 两 个 保留 字 : break 和 continue， 它 们 用 来 辅助 控制 循环 执行 。 
break 用 来 跳出 最 内 层 for 或 while 循环 ， 脱 离 该 循环 后 程序 从 循环 代码 后 继续 
执行 ， 例 如 : 
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£0r 3 Ln "BIT 


for i in range(10): 


1 

3 Print(s, end="") 
4 if s=="I": 
5 


break 


程序 执行 后 的 结果 如 下 : 


语句 只 有 能 力 跳 层次 循环 。 

continue 用 来 结束 当前 当 次 循环 ， 即 跳出 循环 体 中 下 面 尚未 执行 的 语句 ， 但 不 
跳出 当前 循环 。 对 于 while 循环 ， 继 续 求 解 循 环 条 件 。 而 对 于 for 循环 ， 程 序 流程 接 
着 遍历 循环 列表 。 对 比 continue 和 break 语句 ， 如 下 : 


业 for 8 in "PYTHON": 1 for a Ln "PYTHON: 
2 if s=="T": 电 if s=="T": 

3 continue 3 break 

4 Print(s, end="") 4 Print(s, end="") 


两 个 程序 执行 后 的 结果 分 别 如 下 : 


continue 语句 和 break 语句 的 区 别 是 ，continue 语句 只 结束 本 次 循环 ， 而 不 终止 
整个 循环 的 执行 ， 而 break 语句 则 是 结束 整个 循环 过 程 ， 不 再 判断 执行 循环 的 条 件 
是 否 成 立 。 

for 循环 和 while 循环 中 都 存在 一 个 else 扩展 用 法 。else 中 的 语句 块 只 在 一 种 条 
件 下 执行 ， 即 循环 正常 遍历 了 所 有 内 容 或 由 于 条 件 不 成 立 而 结束 循环 ， 没 有 因为 
break 或 returm 〈 函 数 返 回 中 使 用 的 保留 字 ) 而 退出 。continue 保留 字 对 else 没有 影 
响 。 看 下 面 两 个 例子 : 


1 | for s in "PYTHON : 于 for s in “PYTHON": 
2 if s=="T": 2 if s=="T": 

3 continue 3 break 

4 print(s, end="") a print(s, end="") 
5 | else: 5 else: 

6 print ("正常 退出 ") 6 print ("正常 退出 ") 


两 个 程序 执行 后 的 结果 分 别 如 下 : 
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>>> | Rss 
PYHON 正常 退出 PY 
思考 与 练习 


4.13 判断 题 : 所 有 for 循环 语句 都 可 以 用 while 循环 语句 改写 。 
4.14 判断 题 : while 循环 只 能 用 来 实现 无 限 循 环 的 编程 。 
4.15 判断 题 : 死 循环 对 编程 没有 任何 益处 。 


4.16 ”下 面 不 是 while 循环 的 特点 的 是 ( 和 
A 后 B. 能 够 实现 无 限 循 环 
C. 如 果 不 小 心 会 出 现 死 循环 D. 必须 提供 循环 的 次 数 
4.17 以 下 可 以 终结 一 .个 循环 的 保留 字 是 人 ”5 
A. if B. break C._éxit D. continue 


4.5 模块 2: random 库 的 使 用 


Ssesesde es edebs ee 


4.5.1 random 库 概 述 


随机 数 在 计算 机 应 用 中 十 分 常见 ，Python 内 置 的 random 库 主 要 用 于 产生 各 种 
分 布 的 伪 随 机 数 序列 。random 库 采 用 梅森 旋转 算法 (Mersenne Twister) 生成 伪 随 机 
数 序 列 ， 可 用 于 除 随 机 性 要 求 更 高 的 如 解密 算法 外 的 大 多 数 工 程 应 用 。 

使 用 random 库 的 主要 目的 是 生成 随 ; ， 因 此 ， 读 者 只 需要 查阅 该 库 中 随机 
数 生 成 函数 ， 找到 符合 使 用 场景 的 函数 即 可 。 该 库 提供 了 不 同类 型 的 随机 数 函数 ， 
所 有 函数 都 是 基于 最 基本 的 | random. random0 汪 数 扩展 实现 。 


拓展 : 伪 随 机 数 和 真 随 栅 攻 一 一 一 


“ ”随机 数 或 随机 事件 是 不 确定 性 的 产物 ， 其 结果 是 不 可 预测 、 产 生 之 前 不 可 预 
' 见 。 无 论 计算 机 产生 的 随机 数 看 起 来 多 么 “随机 ”， 它 们 也 不 是 真正 意义 上 的 随 ; 
' 机 数 。 因 为 计算 机 是 按照 一 定 算法 产生 随机 数 的 ， 其 结果 是 确定 的 、 可 预见 的 ， 
; 称 为 “ 伪 随 机 数 "。 真正 意 义 上 的 随机 数 不 能 评价 。 如 果 存 在 评价 随机 数 的 方法 ，; 
\ 即 判断 一 个 数 是 否 是 随机 数 ， 那 么 这 个 随机 数 就 有 确定 性 ， 将 不 再 是 随机 数 。 ， 


一 一 一 一 一 一 一 一 一 一 一 一 


4.5.2 random 库 解 析 


表 4.3 列 出 了 random 库 常 用 的 9 个 随机 数 生成 函数 。 
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3 random 库 的 常用 函数 ( 共 


初始 化 随机 数 种 子 ， 于 认 为 当前 系统 时 间 
生成 一 个 [0.0, 1.0) 之 间 的 随机 小 数 

randint(a, b) 
getrandbits(k) 村 长 度 | 的 随机 整 闻 
randrange(start, stop[, step]) 和 ; 

uniform(a, b) TD SR 
choice(seq) 从 序列 类 型 ， HO 中 随机 氨 何 一 个 元 素 ) 
shuffle(seq) 将 序列 类 型 中 的 元 素 随机 排列 ， 返 回 打 乱 后 的 序列 
sample(pop, k) 从 pop 类 型 中 随机 选取 上 个 元 素 ， 以 列表 类 型 返回 


random 库 的 引用 方法 与 math 库 一 样 ， 可 以 采用 下 面 两 种 方式 实现 : 


import random 


i NO) 


random() 


或 


from random import * 
使 用 random 库 的 一 些 例子 如 下 ， 请 读者 注意 ， 这 些 语 句 每 次 执行 后 的 结果 不 
一 定 一 样 : 


生成 随机 数 之 前 可 以 通过 seed() 函 数 指定 随 子 一 般 是 一 个 
整数 ， 只 要 种 子 相 同 ， 每 次 生成 的 随机 数 序列 也 相同 。 这 种 情况 便于 测试 和 同 亚 数 
和 


据 ， 例 
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3 tT}. {}" me 10) randint (1, 10) ， Sp 10)) 
5 3 , 

>>>seed (125) # 再 次 给 随机 数 种 子 赋值 125 
>>>"{}.{}.1{}".format(randint (1,10) ,randint (1,10) ,randint (1,10)) 
4a. 4 LO 


上 述 语句 可 以 看 出 ， 在 设 定 相同 种 子 后 ， 每 次 调用 随机 函数 生成 的 随机 数 是 
相同 的 ) 这 是 随机 数 种 子 的 作用 ， 也 是 伪 随 机 序列 的 应 用 之 一 。 


思考 与 练习 练习 2， | 
4.18 从 random 库 中 选取 相应 的 函数 满足 下 列 EN | 
(1) 随机 生成 100 内 的 10 个 整数 。 CQ "ohbeso eA 9 es 
(2) 随机 选取 0 到 100 间 的 奇数 。 x = ronotint C i ,加 "ol 


(3》 从 字符 串 'abcdefgh 闻 中 随机 选取 4 个 字符 。 
(4) 随 术 迁 取 列表 [ apple', 'pear', 'peach', orangel 中 的 1 个 字 符 串 。 


| ,J 4 让 


-3 70 | 
KE VA 4.6 实例 6: 区 的 计算 


x (圆周 率 ) 是 数学 和 物理 学 普遍 存在 的 常数 之 一 ， 它 定义 了 一 个 标准 圆周 长 
与 直径 之 比 。 众 所 周知 ，r 是 一 个 无 理 数 ， 即 无 限 不 循环 小 数 。 精 确 求解 圆周 率 x 
是 几何 学 、 物 理学 和 很 多 工程 学 科 的 关键 。 
对 x 的 精确 求解 曾经 是 数学 历史 上 一 直 难 以 解决 的 问题 之 一 ， 因 为 x 无 法 用 任 
何 精确 公式 表示 ， 在 电子 计算 机 出 现 以 前 ，r 只 能 通过 一 些 近似 公式 的 求解 得 到 ， 
oh | 1948 pe 人 类 才 以 人 工 计 算 方 式 得 到 的 808 位 精确 小 数 。 
为 止 求解 圆周 率 最 好 的 方法 是 利用 BBP 公式 ， 该 公式 如 下 : 
| 1 4 2 1 1 
= De rd] 
eh 数学 家 找到 了 求解 的 另类 方法 ; 蒙特 卡 罗 (Monte Carlo) 
统计 试验 方法 。 该 方法 属于 计算 数学 的 一 个 分 支 ， 由 于 其 能 
够 真实 地 模拟 实际 物理 过 程 ， 困 此， 解决 问题 与 实际 非常 符合 ， 可 以 得 到 很 圆满 的 
结果 。 蒙 特 卡 罗 方 法 广泛 应 用 于 数学 、 物 理学 和 工程 领域 。 
当 所 要 求解 的 问题 是 某 种 事件 出 现 的 概率 ， 或 者 是 某 个 随机 变量 的 期 望 值 时 ， 
它们 可 以 通过 某 种 “试验 ”的 方法 ， 得 到 这 种 事件 出 现 的 频率 ， 或 者 这 个 随机 变数 
的 平均 值 ， 并 用 它们 作为 问题 的 解 。 这 是 蒙特 卡 罗 方法 的 基本 思想 。 


口 忆 < 
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应 用 蒙特 卡 罗 方 法 求解 的 基本 步骤 如 下 : 随机 向 如 图 4.11 所 示 的 单位 正方 形 
和 圆 结 构 ， 抛 酒 大 量 “ 飞 镖 ” 点， 计算 每 个 点 到 圆心 的 距离 从 而 判断 该 点 在 圆 内 或 
者 圆 外 ， 用 圆 内 的 点 数 除 以 总 点 数 就 是 rw4 值 。 随 机 点 数量 越 大 ， 越 充分 覆盖 整个 
图 形 ， 计 算得 到 的 x 值 越 精确 。 实 际 上 ， 这 个 方法 的 思想 是 利用 离散 点 值 表示 图 形 
的 面积 ， 通 过 面积 比例 来 求解 x 值 。 


图 4.11 计算 x 使 用 的 正方 形 和 图 形 


n=3000 (x 3.16667) 


SN 


0.8 Ee 
0.6 革 
0.4| 


0.2 这 
02 0 
图 4.12 计算 使 用 的 /4 区 域 和 抛 点 过 程 
为 了 简化 计算 ， 一 般 利 用 图 形 的 1/4 求解 zt 值 ， 如 图 4.12 所 示 。 该 问题 的 IPO 


表示 如 下 。 
输入 : 抛 点 数 
处 理 : 计算 每 个 点 到 圆心 的 距离 ， 统 计 在 圆 内 点 的 数量 
输出 : 工 值 


采用 蒙特 卡 罗 方 法 求解 值 的 Python 程序 如 下 : 
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实例 代码 6.1 e6.1CalPi.py 

1 #e6.1CalPi.py 

2 from random import random 

3 from math import sqrt 

4 from time import clock 

3 DARTS = 10000 

6 hits = 0.0 

7 clock () 

8 for i in range(l, DARTS+1): 

9 x, Y = random(), random() 

10 dist = 了 x* 2 + y  ** 2) 

11 if dist <= 

12 hits = hits + 1 久 时 固 功 
13 | Pi = 4 * (hits/DARTS) 

14 | print ("Pi 值 是 {}.".format (pi)) 

15 | print ("运行 时 间 是 : {:5.5}s".format (clock ())) 


上 述 代 码 中 ，random0 函 数 随机 返回 一 个 在 [0,1) 之 间 的 浮 点 数 ， 用 两 个 随机 数 给 
出 随机 抛 点 (xy) 的 坐标 。 sqrt0 函 数 来 自 圭 数学 库 math， 用 来 求解 输入 数据 的 平方 根 。 
第 一 次 调用 clock0 函 数 启 动 一 个 新 的 过 时 器 ， ,第 二 次 调动 clock0 函 数 返回 局 动 证 时 器 
后 的 时 间 。 代 码 中 DARTS 表示 掀 点 数 数 初始 始 设 定 为 1 000。 该 程序 运行 结果 如 下 ; 


>>> 


Bi 值 是 3.144. 
运行 时 间 是 : 0.016477s 


WP 3.144， 与 大 家 熟知 的 3.141 5 相差 较 远 ， 原 因 是 DARTS 点 
数量 较 少 , 无 法 更 精确 刻画 面积 的 比例 关系 。 表 4.4 列 出 了 不 同 DARTS 值 情况 下 该 
程序 的 运行 情况 。 

表 4.4 不 同 抛 点 数 产生 的 精度 和 运行 时 间 


DARTS | 


2 3.109 375 0.011s 
pA 3.138 671 0.012s 
om 3.150 390 0.014s 
2 3.143 554 0.018s 
2 3.141 357 0.030s 
pA 3.147 827 0.049s 
2 3.141 967 0.116s 
人 3.144 577 0.363 s 
229 3.142 669 677 7 1.255 s 


3.141 697 883 6 40.13s 


源 代码 4-6， | 
蒙特 卡 罗 方法 解 
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可 以 看 到 ， 随 着 DARTS 数量 的 增加 ， 当 达到 2” 数量 级 时 ，xt 的 值 就 相对 准确 
了 。 进 一 步 增加 DARTS 数量 ， 能 够 进一步 增加 zx 的 精度 。 

本 节 以 区 的 计算 为 例 ， 重 点 讲解 蒙特 卡 罗 方 法 ， 希 望 读 者 能 够 将 该 方法 运用 到 
其 他 工程 问题 中 。 当 然 , 求解 x 可 以 使 用 BBP 公式 , 请 读者 根据 本 节 开 始 给 出 的 公 
式 编写 代码 ， 用 另 一 种 方法 获得 x 的 值 。 

拓展 : 圆周 率 晶 

圆周 率 日 是 一 年 一 度 庆祝 数学 常数 元 的 节日 ， 由 大 学 倡导 ， 在 一 些 大 学 数学 ; 
系 会 有 庆祝 活动 。 圆 周 率 日 在 每 年 的 3 月 14 日， 通常 庆祝 活动 在 下 午 1 时 59 分 | 
开始 ， 和 象征 圆周 率 的 6 位 近似 值 3.141 59， 有 时 甚至 精确 到 26 秒 开始 ， 以 象征 贺 
周 率 的 8 位 近似 值 3.141 592 6。 对 于 那些 习惯 24h 计时 的 人 ， 可 以 在 3 月 14 日 
凌晨 1 时 59 分 或 者 下 午 3 时 9 分 (15 时 9 分 ) 开始 庆祝 。 
| 一 一 竞 然 还 有 圆周 率 日 ! 有 没有 自然 对 数 日 ? 有 没有 无 作业 日 ? 
只 要 人 类 还 有 创造 力 ， 什 么 特殊 日 子 都 可 能 有 。 


NS 


“ 


思考 与 练习 
4.19 ”请 修改 代码 ， 随 机 生成 更 多 的 点 ， 观 察 z 的 值 是 否 更 加 精确 。 
4.20 ”怎样 让 计算 的 程序 每 次 运行 结果 都 一 样 ? 
4.21 请 调研 一 下 ， 还 有 哪些 计算 问题 可 以 用 蒙特 卡 罗 方 法 求解 ? 


4.7 程序 的 异常 处 理 


a 


4.7.1 异常 处 理 : try-except 语句 


观察 下 面 这 段 小 程序 : 


1 num = eval (input ("请 输入 一 个 整数 : ")) 


各 Print (num**2) 


当 用 户 输入 数字 时 ， 程 序 正常 执行 ， 如 果 用 户 输入 的 不 是 数字 呢 ? 


>>> 


请 输入 一 个 整数 : 100 


10000 
>>> 
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FS 
| 


可 以 看 到 ，Python 解释 器 返回 了 异常 信息 ,同时 退出 程序 ,图 4.13 具体 说 明了 
这 个 异常 信息 中 各 部 分 的 含义 。 
异常 文件 路 径 异常 发 生 的 代码 行 数 


Traceback (most recent \call last): 
异常 回调 Pile |"D:/PythonpL/echoInt.py", |line 1,| in <module> 
标记 


num = eval (input ("请 输入 一 个 整数 : ")) 
File "<string>", line 1, in <module> 


NameError: name 'No' is not defined 
异常 类 型 异常 内 容 提 示 
图 4.13 Python 异常 信息 含义 说 明 
Python 异常 信息 中 最 重要 的 部 分 是 异常 类 型 它 表 明 发 生 异 常 的 原因 ， 也 是 程 


序 处 理 异 常 的 依据 。 
Python 使 用 try-except 语句 实现 异常 处 理 ， 其 基本 语法 格式 如 下 : 


ts 
< 语句 块 1> 
except < 异常 类 型 >: 
< 语句 块 2> 
语句 块 1 是 正常 执行 的 程序 内 容 ， 当 发 生 异 常 时 执行 except 保留 字 后 面 的 语 名 
块 ， 为 上 述 小 程序 增加 异常 处 理 ， 代 码 如 下 : mR | 
i bi yr 
2 num = eval (input ("请 输入 一 个 整数 : ") ) anode dni 
3 Print (num**2) 
4 except NameError: 
5 print ("输入 错误 ， 请 输入 一 个 整数 !") 
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拓展 河 异常 和 错误 


人 ”编程 语言 的 异常 和 错误 是 两 个 相似 但 不 同 的 概念 。 异常 和 错误 都 可 能 引起 程 ， 
! 序 执行 错误 而 退出 ， 它们 属于 程序 没有 考虑 到 的 例外 情况 (exception )。 然而， 绝 ， 
; 大 多 数 不 可 控 因 素 是 可 以 预见 的 ， 例如 ， 程序 期 望 获得 数字 输入 却 得 到 了 其 他 字 ; 
; 符 输 入 .打开 一 个 不 存在 的 文件 等 .这 种 可 以 预见 的 例外 情况 称 为 “异常 ”人 checked | 
exception )， 异 常 发 生 后 经 过 妥善 处 理 可 以 继续 执行 。 另外 一 些 因为 程序 编码 逻辑 ， 
产生 的 不 可 预见 的 例外 情况 称 为 “错误 ”( unchecked exception ), 错误 发 生 后 程序 | 
无 法 恢复 执行 ， 而 且 程 序 本 不 该 处 理 这 类 可 能 的 例外 ， 例 如 ， 对 于 一 个 包含 5 个 ， 
字符 的 字符 囊 ， 程序 去 索引 其 中 第 6 个 元 素 ， 这 种 错误 完全 可 以 避免。 | 


4.7.2 异常 的 高 级 用 法 


除了 最 基本 的 try-except 用 法 ，Python 异常 还 有 一 些 略 微 高 级 的 用 法 ， 这 些 方 
法 在 实际 程序 设计 中 也 十 分 常用 。 
try-except 语句 可 以 支持 多 个 except 语句 ， 语 法 格式 如 下 : 
EY 
< 语 甸 块 1> 
except < 异常 类 型 1>: 
< 语句 块 2> 


except < 异常 类 型 N> 
< 语句 块 N+1> 
except: 
< 语句 块 N+2> 
其 中 , 第 1 到 第 N 个 except 语句 后 面 都 指定 了 异常 类 型 ,说 明 这 些 except 所 包 
含 的 语句 块 只 处 理 这 些 类 型 的 异常 。 最 后 一 个 except 语句 没有 指定 任何 类 型 ， 表示 
它 已 对 应 的 语句 块 可 以 处 理 所 有 其 他 异常 。 这 个 过 程 与 if-elif-else 语句 类 似 ， 是 分 支 
结构 的 一 种 表达 方式 ， 例 如 如 下 代码 : 


alp = "ABCDEFGHIJKLMNOPQRSTUVWXYZ" 
idx = eval (input ("请 输入 一 个 整数 : ")) 
Print(alp[idx]) 
except NameError: 
Print ("输入 错误 ， 请 输入 一 个 整数 !") 
except: 


Print ("其 他 错误 ") 


OO J oO WW ND 畏 


该 程序 将 用 户 输入 的 数字 作为 索引 从 字符 串 alp 中 返回 一 个 字符 ， 当 用 户 输入 
非 整数 字符 时 ，except NameError 异常 被 捕获 到 ， 提 示 用 户 输入 类 型 错误 ， 当 用 户 


第 4 章 程序 的 控制 结构 119 


输入 数字 不 在 0 到 25 之 间 时 ， 蜡 常 被 except 捕获， 程序 打印 其 他 错误 信息 ， 执 行 
过 程 和 结果 如 下 : 


除了 try 和 except 保留 字 外 , 异常 语句 还 可 以 与 else 和 finally 保留 字 配 合 使 用 ， 
语法 格式 如 下 : 

try: 
< 语句 块 1> 
except < 异常 类 型 1>: 

< 语句 块 2> 
else: 

< 语句 块 3> 
finally: 

< 语句 块 4> 


此 处 的 else 语句 与 for 循环 和 while 循环 中 的 else 一 样 ， 当 try 中 的 语句 块 1 正 
常 执行 结束 且 没 有 发 生 异 常 时 , else 中 的 语句 块 3 执行 , 可 以 看 作 是 对 try 语句 块 正 
常 执 行 后 的 一 种 追加 处 理 。finally 语句 块 则 不 同 , 无 论 try 中 的 语句 块 1 是 否 发 生 异 
常 ,语句 块 4 都 会 执行 , 可 以 将 程序 执行 语句 块 1 的 一 些 收尾 工作 放 在 这 里 , 例如 ， 
关闭 、 打 开 文件 等 。 采 用 这 些 保留 字 的 异常 处 理 控制 流 过 程 如 图 4.14 所 示 。 


Pt Ee 
-二 二 六 < 语句 决 1> -二 二 六 -< 语句 块 1> 
| except < 异常 类 型 1> -= 一 except < 异常 类 型 1> 
| < 语句 块 2> Es 
[二 二 else else 
F 二 三 二 < 语句 块 3> | < 语句 块 3> 
-= na: -finally: 
.> < 语句 央 4> .< 语句 决 4> 
(a) 正常 处 理 流程 (b) 异常 处 理 流程 


图 4.14 异常 处 理 控制 流 过 程 
采用 else 和 finally 修改 代码 如 下 : 


try: 
alp = "ABCDEFGHIJKLMNOPQRSTUVWXYZ" 
idx = eval (input ("请 输入 一 个 整数 : ")) 
print (alp[idx]) 


ND 


ee 


源 代 码 4-9: 


4 


异常 处 理 的 小 例 :; 


:阶段 测试 4-2 
:python 异常 处 理 
小 测验 
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except NameError: 
print ("输入 错误 ， 请 输入 一 个 整数 !") 
else: 
print ("没有 发 生 异 常 ") 
finally: 
0 print ("程序 执行 完毕 ， 不 知道 是 否 发 生 了 异常 ") 


PPD oo ~ Un 


执行 过 程 和 结果 如 下 : 


Python 能 识别 多 种 异常 类 型 ， 但 不 建议 读者 编写 程序 时 过 度 依赖 try-except 这 
种 异常 处 理 机 制 。try-except 异常 一 般 只 用 来 检测 极 少 发 生 的 情况 ,例如 ， 用户 输入 
的 合 规 性 或 文件 打开 是 否 成 功 等 。 对 于 本 节 小 例子 中 索引 字符 串 超过 范围 的 情况 应 
该 尽量 在 程序 中 采用 让 语句 直接 判断 ， 而 避免 通过 异常 处 理 来 应 对 这 种 可 能 发 生 的 
“错误 ”。 

对 于 面向 商业 应 用 的 软件 产品 ， 稳 定性 和 可 靠 性 是 最 重要 的 衡量 指标 之 一 。 卓 
使 这 类 软件 产品 也 不 会 滥用 try-except 类 型 语句 。 因为 采用 try-except 语句 会 影响 代 
码 的 可 读 性 ， 增 加 代码 维护 难度 ， 因 此 ， 一 般 只 在 关键 地 方 采用 try-except 类 型 语 
句 处 理 可 能 发 生 的 异常 。 建 议 读者 结合 函数 设计 统筹 应 用 异常 处 理 。 更 多 经 验 还 需 
要 实践 来 积累 。 

一 一 没 看 懂 ， 到 底 该 什么 时 候 该 使 用 异常 语句 呢 ? 

一 一 程序 员 都 是 对 它 又 爱 又 恨 ， 其 实 ， 想 用 就 用 吧 ， 用 户 体 验 好 才 是 王道 ! 


思考 与 练习 
4.22 请 阐述 一 下 try、except、else、finally 保留 字 在 异常 处 理 中 的 作用 。 
4.23 ”如 何 利 用 异常 处 理 机 制 判 断 用 户 输入 的 合 规 性 ? 
4.24 ”如 果 不 用 异常 处 理 机 制 ， 还 有 什么 办 法 判断 用 户 输 入 的 合 规 性 ? 


本 章 小 结 


本 章 主要 讲解 程序 的 基本 结构 ， 包 括 分 支 结 构 和 循环 结构 ， 介 绍 身 体质 量 指数 
BMI 的 计算 ,用 实例 说 明 分 支 结构 的 使 用 。 本章 同时 介绍 了 一 个 常用 标准 库 random 


第 4 章 程序 的 控制 结构 121 
库 ， 利 用 它 实 现 了 蒙特 卡 罗 方 法 求解 z 的 过 程 。 最 后 介绍 了 程序 的 异常 处 理 操作 。 


程序 练习 4-3: 3 
程序 练习 证 章节 程序 练习 题 ; 


4.1 猜 数 游戏 。 在 程序 中 预 设 一 个 0-9 之 间 的 整数 ， 让 用 户 通过 键盘 输入 所 猜 
的 数 ， 如 果 大 于 预 设 的 数 ， 显 示 “ 遗 做 ， 太 大 了 ”小 于 预 设 的 数 ， 显 示 “ 遗 做 ， 太 
小 了 ”如 此 循环 ， 直 至 猜 中 该 数 ， 显 示 “预测 N 次 ， 你 猜 中 了 1>， 其 中 本 是 用 户 [ 国 ]F 
输入 数字 的 次 数 。 


dal a eit es Ee 
出 其 中 英文 字符 、 z, (ete Yih 1 ZI 


4.3 最 大 公 届 吉 证 键盘 接收 两 个 整数 ， 序 求 出 这 两 个 整数 的 最 大 
We 
数 的 积 除 以 最 大 公约 数 即 可 )。 

4.4 猜 数 游戏 续 。 改 编程 序 练习 题 4.1， 让 计算 机 能 够 随机 产生 一 个 预 设 数字 ， 
范围 在 0 一 100 之 间 ， 其 他 游戏 规则 不 变 。 

4.5” 猜 数 游戏 续 。 对 于 程序 练习 题 4.4 程序 ， 当 用 户 输 入 的 不 是 整数 (如 字母 、 
浮 点 数 等 ) 时 ， 程 序 会 终止 执行 退出 。 改 编 该 程序 ， 当 用 户 输入 出 错时 给 出 “输入 
内 容 必 须 为 整数 !” 的 提示 ， 并 让 用 户 重新 输入 。 

4.6 羊 车 门 问题 。 有 3 扇 关 闭 的 门 ， 一 扇 门 后 面 停 着 汽车 ， 其 余 门 后 是 山羊 ， 

只 有 主持 人 知道 每 扇 门 后 面 是 什么 。 参 赛 者 可 以 选择 一 扇 门 ， 在 开启 它 之 前 ， 主 持 
人 会 开启 另外 一 扇 门 ， 露 出 门 后 的 山羊 ， 然 后 允许 参赛 者 更 换 自 己 的 选择 。 请 问 : 
参赛 者 更 换 选 择 后 能 和 否 增加 猜 中 汽车 的 机 会 ? 这 是 一 个 经 典 问题 。 

请 使 用 random 库 对 这 个 随机 事件 进行 预测 ， 分 别 输出 参赛 者 改变 选择 和 坚持 
选择 获胜 的 机 率 。 

4.7 ”请 用 异常 处 理 改造 实例 1， 使 其 能 够 接收 并 处 理 用 户 的 任何 输入 。 


人 


J 
pn 


om 


Wo 
oe 


人 


二 


由 


wh 
由 


Wn 


oo 
a 
oo 


中 


> 


二 


= 


0 


So 
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必 刀 友 订 数 闫 笑 提 酌 庐 旋 太 入 让 大， 于 好 秦 以 更 旧 天 区 和 提 《大 挤 骨 褒 埃 族 。 
Measuring programming progress by lines of code is like measuring aircraft 
building progress by weight. 
比尔 。 六 次 (Bill Gates) 
微软 公司 创始 人 、 软 件 工程 师 、 慈 善 家 
连续 22 年 (1995 一 2016) 蝉 联 《 福 布 斯 》 全 球 富豪 榜首 富 


加 neo 了 
学 习 目标 : 


， (1) 掌握 函数 的 定义 和 调用 方法 。 
' (2) 理解 函数 的 参数 传递 过 程 以 及 变量 的 作用 范围 。 
， (3) 了 解 lambda 函数 。 ' 
， (4) 掌握 时 间 日 期 标准 库 的 使 用 。 ' 
， (5) 理解 函数 递归 的 定义 和 使 用 方法 。 

《关于 一 条 连续 而 无 切线 ,可 由 初等 几何 构 作 的 曲线 》 是 最 早 提 到 科 赫 曲线 的 书 
籍 。 科 赫 曲 线 是 一 种 外 形 类 似 雪花 的 几何 曲线 ,又 称 为 雪花 曲线 。 作 为 分 形 曲线 的 一 


种 ， 它 是 数学 的 抽象 ， 具 有 无 限 精 细 的 结构 。 在 科 赫 曲线 基础 上 产生 的 科 赫 雪花 更 
加 美丽 。 
用 程序 绘制 科 赫 曲线 ， 探 求 雪花 构成 的 极限 奥秘 ， 即 刻 开始 ! 
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5.1 函数 的 基本 使 用 


So 


函数 是 一 段 具有 特定 功能 的 、 可 重用 的 语句 组 ， 用 函数 名 来 表示 并 通过 函数 名 
进行 功能 调用 。 函 数 也 可 以 看 作 是 一 段 具 有 名 字 的 子 程序 ， 可 以 在 需要 的 地 方 调用 
执行 ， 不 需要 在 每 个 执行 的 地 方 重复 编写 这 些 语 句 。 每 次 使 用 函数 可 以 提供 不 同 的 
参数 作为 输入 ， 以 实现 对 不 同 数据 的 处 理 ; 函数 执行 后 ， 还 可 以 反馈 相应 的 处 理 
结果 。 

函数 能 够 完成 特定 功能 ， 与 黑 盒 类 似 ， 对 函数 的 使 用 不 需要 了 解 函 数 内 部 实现 
原理 ， 只 要 了 解 函数 的 输入 输出 方式 即 可 。 严 格 地 说 ， 函 数 是 一 种 功能 抽象 。 

有 些 函数 是 用 户 自己 编写 的 ， 称 为 自 定义 函数 ， Python 安装 包 也 自 带 了 一 些 函 
数 和 方法 ， 包 括 Python 内 置 的 函数 (如 abs()、eval())、Python 标准 库 中 的 函数 〈 如 
math 库 中 的 sqrtD ) 等 。 

使 用 函数 主要 有 两 个 目的 : 降低 编程 难度 和 代码 重用 。 函 数 是 一 种 功能 抽象 ， 
利用 它 可 以 将 一 个 复杂 的 大 问题 分 解 成 一 系列 简单 的 小 问题 ， 然 后 将 小 问题 继续 划 
分 成 更 小 的 问题 ， 当 问题 细 化 到 足够 简单 时 ， 就 可 以 分 而 治之 ， 为 每 个 小 问题 编写 
程序 ， 并 通过 函数 封装 ， 当 各 个 小 问题 都 解决 了 ， 大 问题 也 就 迎刃而解 。 这 是 一 种 
自 顶 向 下 的 程序 设计 思想 ，8.3 节 将 详细 介绍 这 种 设计 思想 。 函 数 可 以 在 一 个 程序 
中 的 多 个 位 置 使 用 ， 也 可 以 用 于 多 个 程序 ， 当 需要 修改 代码 时 ， 只 需要 在 函数 中 修 
改 一 次 ， 所 有 调用 位 置 的 功能 都 更 新 了 ， 这 种 代码 重用 降低 了 代码 行 数 和 代码 维护 
难度 。 

Python 使 用 def 保留 字 定 义 一 个 函数 ， 语 法 形式 如 下 : 

def < 函数 名 > (< 参数 列表 >) : 

< 函数 体 > 
return < 返回 值 列 表 > 

函数 名 可 以 是 任何 有 效 的 Python 标识 符 ; 参数 列表 是 调用 该 函数 时 传递 给 它 的 
值 ， 可 以 有 零 个 、 一 个 或 多 个 ， 当 传递 多 个 参数 时 各 参数 由 逗号 分 隔 ， 当 没有 参数 
时 也 要 保留 圆 括号 。 函 数 定义 中 参数 列表 里 面 的 参数 是 形式 参数 ， 简 称 为 “ 形 参 ” 
函数 体 是 函数 每 次 被 调用 时 执行 的 代码 , 由 一 行 或 多 行 语句 组 成 。 当 需要 返回 值 时 ， 
使 用 保留 字 return 和 返回 值 列 表 ， 和 否则 函数 可 以 没有 return 语句 ， 在 函数 体 结束 位 
置 将 控制 权 返 回 给 调用 者 。 
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函数 调用 和 执行 的 一 般 形式 如 下 : 

< 函数 名 >(< 参 数列 表 >) 

此 时 ， 参 数列 表 中 给 出 要 传 入 函数 内 部 的 参数 ， 这 类 参数 称 为 实际 参数 ， 简 称 
为 “ 实 参 ”。 

【 微 实 例 5.1】 生 日 歌 。 

过 生日 时 要 为 朋友 唱 生日 歌 ， 歌 词 为 

Happy birthday to you! 

Happy birthday to you! 

Happy birthday, dear < 名 字 > 

Happy birthday to you! 

编写 程序 为 Mike 和 Lily 输出 生日 歌 。 最 简单 的 实现 方法 是 重复 使 用 print0 语 
句 ， 对 Mike 的 生日 歌 输出 如 下 : 


print("Happy birthday to you!") 
print("Happy birthday to you!") 


WB DD ,人 己 


print("Happy birthday, dear Mike!") 
4 | print("Happy birthday to you!") 


其 中 ， 第 1、2、4 行 代码 相同 ， 假 如 需要 将 birthday 改 为 new year， 则 每 处 者 
要 修改 。 为 了 避免 这 种 情况 ， 可 以 用 函数 进行 封装 。 上 述 代码 中 除 第 3 行 有 微小 不 
同 外 其 余 代 码 完全 一 致 ， 这 会 带 来 重复 代码 ， 为 了 能 够 复 用 语句 ， 考 虑 将 代码 修 
改 为 : 


微 实例 5.1 m5.1HappyBirthday.py 


def happy (): 
print("Happy birthday to you!") 
def happyB (name) : 
happy () 
happy () 
print("Happy birthday, dear {}!".format (name)) 
happy () 
happyB ("Mike") 
print() 
happyB ("Lily") 


‘Om 全- 


> 
© 


该 程序 输出 结果 如 下 : 


Happy birthday to you! 
Happy birthday to you! 
Happy birthday, dear Mike! 
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来 指 代 要 输入 函数 的 实际 变量 , 并 参与 完成 函数 内 部 功能 。 第 8 和 第 10 行 调用 两 次 
happyBO 函 数 ， 输 入 的 "Mike" 和 "Lily" 是 实 参 ， 替 换 name， 用 于 函数 执行 。 


5.1.2 ”函数 的 调用 过 程 


程序 调用 一 个 函数 需要 执行 以 下 4 个 步骤 。 

(1) 调用 程序 在 调用 处 暂停 执行 。 

(2) 在 调用 时 将 实 参 复制 给 函数 的 形 参 。 

(3) 执行 函数 体 语句 。 

(4) 函数 调用 结束 给 出 返回 值 ， 程 序 回 到 调用 前 的 暂停 处 继续 执行 。 

对 微 实例 5.1 的 生日 歌 程序 跟踪 分 析 。 第 1 到 第 7 行 是 函数 定义 ， 函 数 只 有 在 
被 调用 时 才 执行 ， 因 此 ， 前 7 行 代码 不 直接 执行 。 程 序 最 先 执行 的 语句 是 第 8 行 的 
happyB("Mike")。 当 Python 执行 到 这 行 时 ， 由 于 调用 了 happyB0O 函 数 ， 当 前 执行 暂 
停 ， 程序 用 实 参 "Mike" 蔡 换 happyB(name) 中 的 形 参 name， 形 参 被 赋值 为 实 参 的 值 ， 
类 似 执 行 了 如 下 语句 : 

name = "Mike" 
然后 ， 使 用 实 参 代替 形 参 执行 函数 体内 容 。 当 函数 执行 完毕 后 ， 重 新 回 到 第 8 行 ， 
继续 执行 余下 语句 。 函 数 第 8 行 的 执行 过 程 如 图 5.1 所 示 ， 这 里 函数 happyBO 的 变 
量 name 被 自动 替换 为 "Mike"。 


name="Mike™ 
happyB ("Mike") 一 一 ~ def hapPyB (name) : 
print() happy () 
happyB ("Lily") happy () 
print("Happy birthday, dear!".format (name)) 
happy () 


图 5.1 微 实例 5.1 中 happyB() 的 被 调用 过 程 


当 程 序 执行 happyBO 函 数 体 时 , 第 一 条 执行 语句 是 happy0 函 数 , 这 也 是 一 个 函 
数 调用 。 因此, Python 暂停 执行 happyBO 函 数 , 将 控制 传递 给 被 调用 的 函数 happy()。 
happy0 函 数 体 包含 了 一 个 简单 的 print 语句 ， 该 语句 执行 后 函数 体 结束 ， 程 序 重新 
返回 调用 happy0 函 数 的 位 置 。 图 5.2 给 出 了 happyO 函 数 调 用 和 返回 的 执行 过 程 。 
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name="Mike®™ 
happyB ("Mike") 一 一 一 一 def happyB (name) : 
print{() happy() 一 一 一 def happy (): 
happyB ("Lily") happy () ee print("Happy birthday to you!") 
print ("Happy birthday, dear!l".format (name)) 
happy () 


图 5.2 微 实例 5.1 中 happy0 的 被 调用 和 返回 过 程 


程序 执行 完 happyB0 函 数 体 后 ， 返 回调 用 该 函数 的 原始 位 置 ， 继 续 执 行 ， 如 图 
5.3 所 示 。 
name="Mike™ 
happyB ("Mike") 一 一 一 一 def happyB (name): 
print () happy () 


happyB ("Lily") happy () 
Print("Happy birthday, dear!".format (name)) 


happy () 
图 5.3” 微 实例 5.1 中 happyBO 的 被 调用 和 返回 过 程 


| 珊 雪 类 病程 


EY ee ee re ee 
om wl 


和 等 画 式 编程 的 主要 思想 是 把 程序 过 程 尽 各 所 成 一 系列 画 数 调 用 ， 通过 表 ， 
A 


5.1.3 ”lambda 通 数 


表 2.1 介绍 了 Python 的 33 个 保留 字 ， 其 中 一 个 是 lambda， 该 保留 字 用 于 定义 
一 种 特殊 的 函数 一 一 匿名 函数 ， 又 称 lambda 函数 。 匿 名 函数 并 非 没 有 名 字 ， 而 是 将 
函数 名 作为 函数 结果 返回 ， 语 法 格式 如 下 : 

< 函数 名 > = lambda < 参数 列表 >: < 表达 式 > 

lambda 函数 与 正常 函数 一 样 ， 等 价 于 下 面 形式 : 

def < 函数 名 > (< 参数 列表 >) : 

return < 表达 式 > 

简单 地 说 ，lambda 函数 用 于 定义 简单 的 、 能 够 在 一 行内 表示 的 函数 ， 返 回 一 个 

函数 类 型 ， 实 例如 下 : 
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lambda 函数 用 于 需要 函数 对 象 的 场景 , 本 书 6.6 节 将 使 用 lambda 函数 定义 列表 
的 排序 原则 。 


思考 与 练习 
5.1 Python 中 定义 函数 的 关键 字 是 〈 )s 
A. def B. define C. function D. defunc 
5.2 ”下列 不 是 使 用 函数 的 优点 的 是 )。 
A. 减少 代码 重复 B. 使 程序 更 加 模块 化 
C. 使 程序 便于 阅读 D. 为 了 展现 智力 优势 


5.3 判断 题 : 函数 在 调用 前 不 需要 定义 ， 拿 来 即 用 就 好 。 
5.4 下 面 Python 程序 中 定义 flO0 时 还 没有 定义 包 O， 这 种 函数 调用 是 否 合法 ? 


1 | def £1(): 

2 £2 () 

3 | def £2(): 

4 Pzrint(" 函 数 E2()") 
51 | 直下 


5.2 函数 的 参数 传递 


要 林 雪 可 以 定义 可 选 参数 ， 使 用 参 款 的 位 置 或 名 称 传 间 参 六 值 ， 根 所 据 ; 
变量 的 不 同 作用 域 有 不 同 的 函数 返回 值 广东 | 


No 


5.2.1 可 选 参数 和 可 变数 量 参数 


在 定义 函数 时 ， 如 果 有 些 参数 存在 默认 值 ， 即 部 分 参数 不 一 定 需 要 调用 程序 输 
入 ， 可 以 在 定义 函数 时 直接 为 这 些 参数 指定 默认 值 。 当 函数 被 调用 时 ， 如 果 没 有 传 
入 对 应 的 参数 值 ， 则 使 用 函数 定义 时 的 默认 值 奉 代 ， 例 如 : 
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由 于 函数 调用 时 需要 按 顺 序 输入 参数 , 可 选 参数 必须 定义 在 非 可 选 参数 的 后 面 ， 
即 dupO 函 数 中 带 默认 值 的 可 选 参数 times 必须 定义 在 str 参数 后 面 。 

在 函数 定义 时 ， 也 可 以 设计 可 变数 量 参数 ， 通 过 在 参数 前 增加 星 号 〈*) 实现 。 
带 有 星 号 的 可 变 参数 只 能 出 现在 参数 列表 的 最 后 。 调 用 时 ， 这 些 参数 被 当 作 元 组 类 
型 传递 到 函数 中 ， 实 例如 下 : 


vfuncO 函 数 定义 了 可 变 参数 b， 调 用 vfunc() 函 数 时 输入 的 (2, 3, 4, 5) 被 当 作 元 组 
传递 给 b， 与 a 累加 后 输出 。6.1 节 将 详细 介绍 元 组 类 型 ， 这 里 请 读者 将 元 组 理解 为 
一 组 元 素 。 


5.2.2 ”参数 的 位 置 和 名 称 传 递 


函数 调用 时 ， 实 参 默 认 采 用 按照 位 置 顺序 的 方式 传递 给 函数 ， 例 如 dup 
("knock~",4) 中 第 一 个 实 参 默认 赋值 给 形 参 str， 第 二 个 实 参 赋值 给 形 参 times。 这 种 
按照 位 置 传递 参数 的 方法 固然 很 好 ， 但 当 参 数 很 多 时 ， 这 种 调用 参数 的 方式 可 读 性 
较 差 。 假 设 func() 函 数 有 6 个 参数 ， 它 的 定义 如 下 ， 其 中 参数 分 别 表 示 两 组 三 维 坐 
标 值 。 

G(R Bl Ly 2 Yr 2): 

return 

它 的 一 个 实际 调用 如 下 : 

TESuUlt = funG(l; ZZ, 3 4 Sr G1) 

如 果 仅 看 实际 调用 而 不 看 函数 定义 ， 很 难 理解 这 些 输入 参数 的 含义 。 在 规模 稍 
大 的 程序 中 ， 函 数 定义 可 能 在 函数 库 中 ， 也 可 能 与 调用 相距 很 远 ， 带 来 的 可 读 性 
较 差 。 

为 了 解决 上 述 问 题 ，Python 提供 了 按照 形 参 名 称 输入 实 参 的 方式 ， 此 时 函数 调 
用 如 下 : 

result = func(x2=4, y2=5, 2z2=6, xl1=1, yl=2, zl1=3) 


由 于 调用 函数 时 指定 了 参数 名 称 ， 所 以 参数 之 间 的 顺序 可 以 任意 调整 。 
5.2.3 ”函数 的 返回 值 


return 语句 用 来 退出 函数 并 将 程序 返回 到 函数 被 调用 的 位 置 继续 执行 。 return 语 
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名 可 以 同时 将 0 个 、1 个 或 多 个 函数 运算 后 的 结果 返回 给 函数 被 调用 处 的 变量 ， 
例如 : 


数 也 可 以 用 return 返回 多 个 值 ， 多 个 值 以 元 组 类 型 保存 ， 例 如 : 


5.2.4 ”函数 对 变量 的 作用 


本 小 节 主 要 讲授 函数 对 程序 中 变量 的 作用 问题 ， 涉 及 组 合 数据 类 型 ， 建 议 读者 
学 完 第 6 章 再 阅读 本 小 节 。 

一 个 程序 中 的 变量 包括 两 类 : 全 局 变量 和 局 部 变量 。 全 局 变量 指 在 函数 之 外 定 
义 的 变量 ， 一 般 没 有 缩 进 ， 在 程序 执行 全 过 程 有 效 。 局 部 变量 指 在 函数 内 部 使 用 的 
变量 ， 仅 在 函数 内 部 有 效 ， 当 函数 退出 时 变量 将 不 存在 。 例 如 : 


这 个 例子 说 明 ， 当 函数 执行 完 退 出 后 ， 其 内 部 变量 将 被 释放 。 
如 果 函 数 内 部 使 用 了 全 局 变量 呢 ? 例如 : 
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函数 func0 内 部 使 用 了 变量 n， 并 且 将 变量 参数 b 赋值 给 变量 n， 为 何 n 值 没有 
改变 ?因为 函数 func0 有 自己 的 内 存 空 间 ， 它 将 n=b 语句 理解 为 生成 一 个 局 部 变量 
n， 并 将 参数 b 赋值 给 它 ， 此 时 func0 函 数 没 有 将 n 当 作 全 局 变量 。 所 以 ， 函 数 退 出 
后 ， 局 部 变量 n 被 释放 ， 全 局 变量 n 的 值 没有 改变 。 

如 果 希 望 让 func0 函 数 将 n 当 作 全 局 变量 ， 需 要 在 变量 n 使 用 前 显 式 声明 该 变 
量 为 全 局 变量 ， 代 码 如 下 : 


OI ET n， 而 是 列表 类 型 ls， 会 怎么 样 呢 ? 理解 如 下 


请 读者 注意 ,奇迹 产生 了 , 与 之 前 的 整数 变量 n 不 同 ,全 局 列表 变量 在 函数 func() 
调用 后 竟然 发 生 了 改变 ! 

一 一 这 是 为 什么 了 灵异 事件 ? 

一 一 Python 才刚 刚 开 始 展现 它 的 魅力 。 

请 读者 查看 6.2.1 节 内 容 ， 列 表 等 组 合 数据 类 型 由 于 操作 多 个 数据 ， 所 以 它们 
在 使 用 中 有 创建 和 引用 的 分 别 。 当 列表 变量 被 方 括号 ([]， 无 论 是 否 为 空 ) 赋值 时 ， 
这 个 列表 才 被 真实 创建 ， 否 则 只 是 对 之 前 创建 列表 的 一 次 引用 。 

上 述 代码 func() 函 数 的 Is.append(b) 语 句 执行 时 需要 一 个 真实 创建 过 的 列表 ， 此 
时 func() 函 数 专 属 的 内 存 空间 中 没有 已 经 创建 过 且 名 称 为 ls 的 列表 ， 因 此 ，func() 
函数 进一步 去 寻找 全 局 内 存 空 间 ， 自 动 关联 全 局 ls 列表 ， 并 修改 其 内 容 。 当 func() 
函数 退出 后 ， 全 局 ls 列表 中 的 内 容 被 修改 。 简 单 地 说 ， 对 于 列表 类 型 ， 函 数 可 以 直 
接 使 用 全 局 列表 而 不 需要 采用 global 进行 声明 。 

如 果 funcO 函 数 内 部 存在 一 个 真实 创建 过 且 名 称 为 ls 的 列表 ， 则 func0 函 数 将 
操作 该 列表 而 不 会 修改 全 局 变量 ， 例 如 : 
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>>>ls = [] ， #1s 是 全 局 列表 变量 


>>>def func (a, b): | = 夫 1 和 
Lal # 创 建 了 名 称 为 1s 的 局 部 列表 变量 列 ee A 
ls.append(b) ”# 将 局 部 变量 b 增 加 到 全 局 列表 变量 1s 中 
return a*b 


>>>s = func("knock~", 3) 


>>>Pzint(s，1s) # 测 试 一 下 1s 值 是 否 改变 
knock~knock~ [] 


总 结 一 下 ，Python 函数 对 变量 的 作用 遵守 如 下 原则 。 

(1) 简单 数据 类 型 变量 无 论 是 否 与 全 局 变量 重 名 ， 仅 在 函数 内 部 创建 和 使 用 ， 
函数 退出 后 变量 被 释放 ， 如 有 全 局 同名 变量 ， 其 值 不 变 。 

(2) 简单 数据 类 型 变量 在 用 global 保留 字 声 明 后 ， 作 为 全 局 变量 使 用 ， 函 数 退 
出 后 该 变量 保留 且 值 被 函数 改变 。 

(3) 对 于 组 合 数据 类 型 的 全 局 变量 ， 如 果 在 函数 内 部 没有 被 真实 创建 的 同名 变 
量 ， 则 函数 内 部 可 以 直接 使 用 并 修改 全 局 变量 的 值 。 

(4) 如 果 函 数 内 部 真实 创建 了 组 合 数据 类 型 变量 ， 无 论 是 否 有 同名 全 局 变量 ， 
函数 仅 对 局 部 变量 进行 操作 ， 函 数 退 出 后 局 部 变量 被 释放 ， 全 局 变量 值 不 变 。 


耗 展 : 指针 和 引用 


人 ”指针 是 保存 内 存 地 址 的 变量 ， 一 般 出 现在 比较 底层 的 程序 设计 语言 中 ， 如 C， 
! 语言 。 引 用 是 某 一 变量 的 别名 ， 用 这 个 名 字 可 以 对 变量 进行 操作 ， 如 Python 列表 ， 
; 类 型 的 引用 。 两 者 的 主要 区 别 是 ， 指 针 直 接 指向 内 存 地 址 ， 说 明 对 象 已 经 生成 ， ; 
; 而 引用 只 是 别名 , 需要 真实 创建 对 象 才能 操作 对 象 ， We 
分 常用 ， 要 格外 注意 该 类 型 真实 创建 和 引用 的 区 别 。 


Sorseeameae ee ds ds 


口 | 思考 与 练习 

5.5 ”如 何 定义 带 有 可 选 参 数 的 函数 ? 

5.6 ”如何 定义 带 有 可 变数 量 参数 的 函数 ? 

5.7 ”假如 return 语句 同时 返回 3 个 值 ， 返 回 值 是 什么 数据 类 型 ? 
5.8 参数 的 位 置 传递 和 名 称 传递 各 有 什么 优 缺 点 ? 

阶段 测试 5_1 5.9 在 函数 中 操作 全 局 列表 类 型 变量 时 需要 注意 什么 问题 ? 


5$.3 模块 3: datetime 库 的 使 用 


要 下 Python 时 间 处 理 的 标准 本 才 库 datetime 提供 了 一 批 显示 日 期 和 时间 
! 的 格式 化 方法 。 


Me eS pa eb 
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5.3.1 datetime 库 概 述 


以 不 同 格式 显示 日 期 和 时 间 是 程序 中 最 常用 到 的 功能 。Python 提供 了 一 个 处 理 
时 间 的 标准 函数 库 datetime， 它 提供 了 一 系列 由 简单 到 复杂 的 时 间 处 理 方法 。 
datetime 库 可 以 从 系统 中 获得 时 间 ， 并 以 用 户 选 择 的 格式 输出 。 

datetime 库 以 格林 威 治 时 间 为 基础 , 每 天 由 3 600X24 秒 精准 定义 。 该 库 包 括 两 
个 常量 : datetime.MINYEAR 与 datetime.MAXYEAR， 分 别 表示 datetime 所 能 表示 
的 最 小 、 最 大 年 份 ， 值 分 别 为 1 与 9999。 

datetime 库 以 类 的 方式 提供 多 种 日 期 和 时 间 表 达 方 式 。 

(1) datetime.date: 日 期 表示 类 ， 可 以 表示 年 、 月 、 日 等 。 

(2) datetime.time: 时 间 表 示 类 ， 可 以 表示 小 时 、 分 钟 、 秒 、 毫 秒 等 。 

(3) datetime.datetime: 日 期 和 时 间 表 示 的 类 ， 功 能 履 盖 date 和 time 类 。 

(4) datetime.timedelta: 与 时 间 间 隔 有 关 的 类 。 

(5) datetime.tzinfo: 与 时 区 有 关 的 信息 表示 类 。 

由 于 datetime.datetime 类 表达 形式 最 为 丰富 ， 这 里 主要 介绍 这 个 类 的 使 用 。 使 
用 datetime 类 需要 用 import 保留 字 ， 引 用 datetime 类 的 方式 如 下 : 


1 | from datetime import datetime 


抚 展 1970 年 1 月 1 日 


人 ”当代 计算 机 系统 都 有 一 个 计时 功能 , 能 够 输出 从 格林 威 治标 准时 间 1970 年 1 
' 月 1 日 00:00:00 开始 到 当下 的 时 间 计数 ， 精 确 到 秒 ， 这 是 UNIX 操作 系统 早期 的 ， 
' 设计 习惯 ， 后 沿用 到 所 有 计算 机 系统 中 。 
! 现在 的 计算 机 硬件 和 系统 都 是 64 位 ， 如 果 用 64 位 存储 这 个 时 间 计 数 则 最 大 ， 


! 因此 ，64 位 计算 机 系统 可 以 将 时 间 表 示 到 约 公 元 22 年 ， 相 信 我 们 的 W 代 子 孙 ， 
' 哪怕 到 地 球 毁 灭 那天 都 不 用 担心 时 间 不 准确 了 。 

一 一 为 什么 选择 从 1970 年 1 月 1 日 开始 ? 

一 一 无 论 选择 从 哪 天 开始 ， 都 会 有 同样 的 问题 ， 不 是 吗 ? 


X=- 


下 
E 
' 
有 


5.3.2 ”datetime 库 解 析 


datetime 类 (datetime.datetime 类 ， 以 下 简称 为 datetime 类 ) 的 使 用 方式 是 首先 
创建 一 个 datetime 对 象 ， 然 后 通过 对 和 象 的 方法 和 属性 显示 时 间 。 创 建 datetime 对 象 
有 3 种 方法 : datetime.now()、datetime.utcnow() 和 datetime.datetime()。 

1. 使 用 datetime.now() 获 得 当前 日 斯 和 时 间 对 象 ， 使 用 方法 如 下 : 


datetime .now () 
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作用 : 返回 一 个 datetime 类 型 ， 表 示 当 前 的 日 期 和 时 间 ， 精 确 到 微 秒 。 
参数 : 无 
调用 次 本 数 ， 执行 结果 如 下 : 


2. 使 用 datetime.utcnow() 获 得 当前 日 期 和 时 间 对 应 的 UTC (世界 标准 时 间 ) 时 
间 对 象 ， 使 用 方法 如 下 : 


datetime .utcnow () 

作用 : 返回 一 个 datetime 类 型 , 表示 当前 日 期 和 时 间 的 UTC 表示 , 精确 到 微 秒 。 
参数 ; 无 

调用 该 函数 ， 执 行 结果 如 下 : 


3. datetime.now() 和 datetime.utcnow() 都 返回 一 个 datetime 类 型 的 对 象 ， 也 可 以 
直接 使 用 datetime() 构 造 一 个 日 期 和 时 间 对 象 ， 使 用 方法 如 下 : 

datetime (year, month, day, hour=0, minute=0,second=0, microsecond=0) 

作用 : 返回 一 个 datetime 类 型 ， 表 示 指 定 的 日 期 和 时 间 ， 可 以 精确 到 微 秒 。 

参数 如 下 。 

year: 指定 的 年 份 ，MINYEAR <= year <= MAXYEAR 

month: 指定 的 月 份 ，1 <= month <= 12 

day: 指定 的 日 期 1 <= day <= 月 份 所 对 应 的 日 期 上 限 

hour: 指定 的 小 时 , 0 <= hour < 24 

minute: 指定 的 分 钟 数 ，0 <= minute < 60 

second: 指定 的 秒 数 ，0 <= second < 60 

microsecond: 指定 的 微 秒 数 ，0 <= microsecond <1000000 

其 中 ，hour、minute、second、microsecond 参数 可 以 全 部 或 部 分 省 略 。 

调用 datetime0) 函 数 直 接 创建 一 个 datetime 对 象 , 表示 2016 年 9 月 16 日 22:33， 
32 秒 7 微 秒 ， 执 行 结 果 如 下 : 


到 此 ， 程 序 已 经 有 了 一 个 datetime 对 象 ， 进 一 步 可 以 利用 这 个 对 象 的 属性 显示 
时 间 ， 为 了 区 别 datetime 库 名 ， 采 用 上 例 中 的 someday 代替 生成 的 datetime 对 和 象 ， 
常用 属性 如 表 5.1 所 示 。 


第 5 章 函数 和 代码 复 用 135 


表 5.1 datetime 类 的 常用 属性 ( 共 9 个 ) 


: 站 于 措 本 
somedar .min 固定 返回 datetime 的 最 小 时 间 对 象 ， datetime lL1,0.0 
someday.max 固定 返回 datetime 的 最 大 时 间 对 象 ， 

datetime(9999,12,31,23,59,59,999999 
someday.year 返回 someday 包含 的 年 份 
someday.month 返回 someday 包含 的 月 份 
someday.da 返回 someday 包含 的 日 期 
someday.hour 返回 someday 包含 的 小 时 
someday.minute 返回 someday 包含 的 分 钟 
someday.second 返回 someday 包含 的 秒 钟 
someday.microsecond 返回 someday 包含 的 微 秒 值 


datetime 对 象 有 3 个 常用 的 时 间 格 式 化 方法 ， 如 表 5.2 所 示 。 
表 5.2 datetime 类 常用 的 时 间 格 式 化 方法 〈 共 3 个) 


TREE Pr 
someday.isoformat() 采用 ISO 8601 标准 显示 时 碍 

someday.isoweekday() 根据 日 期 计算 星期 后 返回 1 一 7, 对 应 星期 一 到 星期 日 
someday.strftime(format) 根据 格式 化 字符 串 format 进行 格式 显示 的 方法 


isoformat() 和 isoweekday() 方 法 的 使 用 如 下 : 


一 二: SS am -< 上 


strftime() 方 法 是 时 间 格 式 化 最 有 效 的 方法 , 几乎 可 以 以 任何 通用 格式 输出 时 间 。 
例如 下 例 所 示 ， 用 该 方法 输出 特定 格式 时 间 。 表 5.3 给 出 了 strftime() 方 法 的 格式 化 
控制 符 。 


年 份 
月 份 
月 名 
%d 01 ~ 31， 例 如 ，25 
%A Monday~Sunday， 例 如 ，Wednesday 
%a Mon~Sun， 例 如 ，Wed 
%H 00 ~23， 例 如 ，12 
%l 01 ~ 12， 例 如 ，7 
Xp AM, PA， 例如 ，PM 
WM 00 ~ 59， 例 如 ，26 


%S | 秒 |00~59, 例如 26 
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strftime() 格 式 化 字符 串 的 数字 左 侧 会 自动 补 零 ， 上 述 格 式 也 可 以 与 print0 的 格 
式 化 函数 一 起 使 用 ， 例 如 : 


datetime 库 主要 用 于 对 时 间 的 表示 ， 从 格式 化 角度 掌握 strftime() 函 数 已 经 能 够 
处 理 很 多 情况 了 。 建 议 读者 在 遇 到 需要 处 理 时 间 的 问题 时 采用 datetime 库 ， 简 化 格 
式 输出 和 时 间 的 维护 。 


思考 与 练习 
5.10 ”请 利用 datetime 库 将 当前 系统 时 间 转 换 为 字符 串 。 
5.11 请 利用 datetime 库 输出 5 种 不 同 的 日 期 格式 。 
5.12 ”思考 如 何 利 用 datetime 库 对 一 个 程序 的 运行 计时 。 


5.4 实例 7: 七 段 数码 管 绘制 


数码 管 是 一 种 价格 便宜 、 使 用 简单 的 发 光电 子 器 件 ， 广 泛 应 用 在 价格 较 低 的 电 
子 类 产品 中 ， 其 中 ， 七 段 数码 管 最 为 常用 。 七 段 数 码 管 (Seven-segment Indicator) 
由 7 段 数 码 管 拼接 而 成 ， 每 段 有 亮 或 不 亮 两 种 情况 ， 改 进 型 的 七 段 数码 管 还 包括 一 
个 小 数 点 位 置 ， 如 图 5.4 所 示 。 


图 5.4 ”七 段 数 公 管 的 结构 图 
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七 段 数码 管 能 形成 2=128 种 不 同 状态 , 其 中 部 分 状态 能 够 显示 易于 人 们 理解 的 
数字 或 字母 含义 ， 因 此 被 广泛 使 用 。 图 5.5 给 出 了 十 六 进 制 中 16 个 字符 的 七 段 数码 
管 表示 。 


BHBEBBGHBBHHY 
RbEEdEF 


图 5.5 十 六 进 制 中 16 个 字符 的 七 段 数 公 管 表 示 


本 节 将 延续 实例 2 和 2.4 节 内 容 , 通过 turtle 库 函 数 绘制 七 段 数 码 管 形式 的 日 期 
信息 。 该 问题 的 IPO 描述 如 下 。 

输入 : 当前 日 期 的 数字 形式 

处 理 : 根据 每 个 数字 绘制 七 段 数码 管 表示 

输出 : 绘制 当前 日 期 的 七 段 数 码 管 表示 

每 个 0 到 9 的 数字 都 有 相同 的 七 段 数码 管 样式 ， 因 此 ， 可 以 通过 设计 函数 复 用 
数字 的 绘制 过 程 。 进 一 步 ， 每 个 七 段 数 码 管 包括 7 个 数码 管 样式 ， 除 了 数码 管 位 置 | 
不 同 外 ， 绘 制 风 格 一 致 ， 也 可 以 通过 函数 复 用 单个 数码 段 的 绘制 过 程 。 这 里 ， 先 给 国 ] 口 | 
出 程序 的 全 部 代码 ， 实 例 代码 7.1 如 下 。 


实例 代码 7.1 e7.1DrawSevenSegDisplay.py 


#e7 .1DrawSevenSegDisPLay.PY 
import turtle, datetime 
def drawLine (draw) ;  # 绘 制 单 段 数码 管 
turtle.pendown() if draw else turtle.penup() 
turtle. fd(40) 
turtle.right (90) 
def drawDigit(d) : # 根 据 数字 绘制 七 段 数码 管 
drawLine (True) if d in [2,3,4,5,6,8,9] else drawLine (False) 


AI WNP 


9 drawLine (True) ifdin [0,1,3,4,5,6,7,8,9] else drawLine (False) 
10 drawLine (True) if d in [0,2,3,5,6,8,9] else drawLine (False) 
31 drawLine (True) if d in [0,2,6,8] else drawLine (False) 

到 turtle.Iett(90) 

13 drawLine (True) if d in [0,4,5,6,8,9] else drawLine (False) 

14 drawLine (True) if d in [0,2,3,5,6,7,8,9] else drawLine (False) 
15 drawLine (True) if d in [0,1,2,3,4,7,8,9] else drawLine (False) 
16 turtle.left (180) 

1 turtle.penup () 

18 turtle.fd(20) 

19 | def drawDate (date) : # 获 得 要 输出 的 数字 
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20 for i in date: 

21 drawDigit(eval (i)) # 注 意 : 通过 eval() 函数 将 数字 变 为 整数 
22 | def main() : 

23 turtle.setup(800, 350, 200, 200) 

24 turt1le .PenupP () 

5 turtle.fd(-300) 

26 turtle.pensize(5) 

27 drawDate (datetime .datetime.now() .strftime ('%Y%m$%d')) 
28 turtle.hideturtle() 

29 | main() 


实例 代码 7.1 定义 了 drawDigit0 函 数 ， 该 函数 根据 输入 的 数字 d 绘制 七 段 数码 
管 ， 结 合 七 段 数码 管 结构 ， 每 个 数码 管 的 给 wa 5.6 所 示 的 顺序 。 


村 EE | 


图 5.6 七 段 数 码 管 的 绘制 顺序 


绘制 起 点 在 数码 管 中 部 元 侧 ， 无 论 每 段 数 码 管 是 否 被 绘制 出 来 ,turtle 画笔 都 按 
顺序 “ 画 完 ”7 个 数码 管 。 对 于 给 定数 字 d， 哪 个 数码 段 被 绘制 出 来 采用 if-else 语 
句 判 断 。 


8 | drawLine (True) if d in [2,3,4,5,6,8,9] else drawLine (False) 


以 第 8 行为 例 ， 代 码 采用 了 单行 if-else 语句 ， 这 种 语句 常用 于 寺 和 else 分 别 只 
有 一 行 语句 的 情形 。 第 8 行 代码 采用 普通 if-else 语句 表达 如 下 ， 可 见 ， 单 行 语句 的 
实现 方式 能 够 使 表达 更 加 紧凑 。 


Ed En fo 3 
drawLine (True) 

else: 
drawLine (False) 


WN 


第 8 行 代码 根据 输入 数字 判断 是 否 要 绘制 七 段 数码 管 最 中 间 的 横 线 ， 当 需要 绘 
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制 时 ， 调 用 绘制 函数 drawLine()， 参数 赋值 True; 当 不 需要 绘制 时 ， 参 数 赋值 False。 
根据 0 一 9 数字 结构 ， 对 于 2、3、4、5、6、8、9 这 些 数字 需要 绘制 ， 否 则 不 需要 绘 
制 。 为 了 使 输出 样式 固定 ， 简 化 设计 ， 当 不 需要 绘制 时 ，turtle 画笔 需要 抬 起 。 

drawLine() 函 数 根据 输出 参数 的 值 (True 或 False) 决定 是 否 抬 起 画笔 。 

为 了 使 代码 模块 化 更 好 , 实例 代码 7.1 定义 了 drawDate() 函 数 和 main() 函 数 。 其 
中 ，drawDate() 函 数 将 更 长 数字 分 解 为 单个 数字 ， 进 一 步调 用 drawDigit() 分 别 绘制 
每 个 数字 。main() 函 数 将 启动 窗 体 大 小 、 设 置 画笔 宽度 、 设 置 系统 时 间 等 功能 封装 
在 一 起 , 但 main0 函 数 并 不 体现 单一 功能 , 这 种 封装 仅 从 提高 代码 可 读 性 角度 考虑 。 
请 读者 逐 行 理解 实例 代码 7.1 的 其 余部 分 ， 该 程序 运行 后 的 效果 如 图 5.7 所 示 。 


=— rr 


cU IoUjcs 


图 5.7 实例 代码 7.1 的 运行 效果 


实例 代码 7.1 给 出 了 最 基本 的 七 段 数 码 管 绘制 程序 ， 可 以 看 出 ， 使 用 函数 能 大 
量 复 用 代码 ， 避 免 相 同 功能 重复 编写 。 此 外 ， 函 数 的 好 处 还 体现 在 对 代码 的 修改 方 
面 。 能 否 绘 制 更 有 趣 的 七 段 数码 管 呢 ? 实例 代码 7.2 给 出 了 图 5.8 的 绘制 风格 ， 请 

进一步 体会 函数 为 编程 带 来 的 便利 。 


| 


图 5.8 实例 代码 7.2 的 运行 效果 
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实例 代码 7.2 e7.2DrawSevenSegDisplay.py 


D vB 上 EN 请 


#e7.2DrawSevenSegDisplay.py 
import turtle, datetime 
def drawGap() : # 绘 制 数码 管 间 隔 
turtle.penup () 
turtie. fa(S) 
def drawLine (draw) :  # 绘 制 单 段 数码 管 
drawGap () 
turtle.pendown() if draw else turtle.penup() 
turtle.fd(40) 
drawGap () 
turtle.right(90) 
def drawDigit(d) : # 根 据 数字 绘制 七 段 数码 管 
drawLine (True) if d in [2,3,4,5,6,8,9] else drawLine (False) 
drawLine (True) ifdin [0,1,3,4,5,6,7,8,9] else drawLine (False) 
drawLine (True) if d in [0,2,3,5,6,8,9] else drawLine (False) 
drawLine (True) if d in [0,2,6,8] else drawLine (False) 
turtle.1left (90) 
drawLine (True) if d in [0,4,5,6,8,9] else drawLine (False) 
drawLine (True) if d in [0,2,3,5,6,7,8,9] else drawLine (False) 
drawLine (True) if d in [0,1,2,3,4,7,8,9] else drawLine (False) 
turtle.left(180) 
turtle.penup () 
turtle. fd(20) 
def drawDate (date) : 
turtle.pencolor ("red") 
for i in date: 
if 主 == '-!': 
turtle.write(' 年 ' ,font=("Arial", 18, "normal")) 
turtle.pencolor ("green") 
turtle.fd(40) 
elif i == '=': 
turtle.write(' 月 ' ,font=("Arial", 18, "normal")) 
turtle.pencolor ("blue") 
turtle.fd(40) 


elif i == '+': 
turtle.write(' 日 ' ,font=("Arial", 18, "normal")) 
else: 


drawDigit (eval (i)) 
def main() : 
turtle.setup(800, 350, 200, 200) 
turtle.penup () 
turtle.fd(-350) 
turtle.pensize(5) 
drawDate (datetime .datetime .now() .strftime('%Y-%m=%d+' )) 
turt1le .hideturtle() 
main() 
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腹 砚 明 计算 机 的 硬件 时 钟 
汪 ”计算 机 断 电 再 次 打开 后 其 系统 时 间 往往 是 准确 的 ， 既 然 已 经 断 电 ， 计 算 机 如 ， 
' 何 能 准确 计时 呢 ? 原来 ， 计算 机 主板 上 有 一 颗 纽扣 电池 , 它 负责 给 硬件 时 钟 供电 。; 
' 这 颗 纽 扣 电池 往往 能 用 几 年 ， 所 以 ， 硬 件 时 钟 产 生 的 时 间 都 是 准确 且 连 续 的 。 计 ， 
' 算 机 的 硬件 时 钟 由 硬件 计时 电路 组 成 。 当 需要 使 用 时 间 时 ， 操 作 系统 会 从 硬件 时 ， 
! 钟 中 读 出 时 间 放 入 内 核 给 应 用 软件 使 用 . 


~ 二 一 一 二 一 全 二 一 全 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


* 


思考 与 练习 
5.13 ”请 说 明 单 行 if-else 语句 有 哪些 作用 ? 
5.14 请 查阅 资料 回答 实例 代码 7.1 中 第 28 行 代码 的 作用 。 
5.15 ”为 什么 实例 代码 7.2 中 第 44 行使 用 '%Y-%m=%d+' 作 为 格式 化 样式 ? 


5.5 代码 复 用 和 模块 化 设计 


' ， 国 晤 。 画 数 是 程序 的 一 种 抽 条 ， 它 通过 封装 实现 代码 复 用 。 可 以 利用 函数 ， 
' 对 程序 进行 模块 化 设计 。 

程序 由 一 系列 代码 组 成 , 如 果 代码 是 顺序 但 无 组 织 的 , 不 仅 不 利于 阅读 和 理解 ， 
也 很 难 进行 升级 和 维护 。 因 此 ， 需 要 对 代码 进行 抽象 ， 形 成 易于 理解 的 结构 。 当 代 
编程 语言 从 代码 层面 采用 函数 和 对 象 两 种 抽象 方式 ， 分 别 对 应 面向 过 程 和 面向 对 象 
编程 思想 。 

函数 是 程序 的 一 种 基本 抽象 方式 ， 它 将 一 系列 代码 组 织 起 来 通过 命名 供 其 他 程 
序 使 用 。 函 数 封装 的 直接 好 处 是 代码 复 用 ， 任 何其 他 代码 只 要 输入 参数 即 可 调用 函 
数 ， 从 而 避免 相同 功能 代码 在 被 调用 处 重复 编写 。 代 码 复 用 产生 了 另 一 个 好 处 ， 当 
更 新 函数 功能 时 ， 所 有 被 调用 处 的 功能 都 被 更 新 。 

面向 过 程 是 一 种 以 过 程 描述 为 主要 方法 的 编程 方式 ， 该 方法 要 求 程序 员 列 出 解 
决 问题 所 需要 的 步骤 ， 然 后 用 函数 将 这 些 步骤 一 步 一 步 实现 ， 使 用 时 依次 建立 并 调 
用 函数 或 编写 语句 即 可 。 面 向 过 程 编程 是 一 种 基本 且 自 然 的 程序 设计 方法 ， 函 数 通 
过 将 步骤 或 子 功能 封装 实现 代码 复 用 并 简化 程序 设计 难度 。 

对 象 是 程序 的 一 种 高 级 抽象 方式 ， 它 将 程序 代码 组 织 为 更 高 级 别 的 类 。 对 象 包 
括 表征 对 象 特 征 的 属性 和 代表 对 象 操作 的 方法 。 例 如 ， 汽 车 是 一 个 对 象 ， 其 颜色 、 
轮胎 数量 、 车 型 是 属性 ， 代 表 汽 车 的 静态 值 ， 前 进 、 后 退 、 转 弯 等 是 方法 ， 代 表 汽 
车 的 动作 和 行为 。 在 程序 设计 中 ， 如 果 <a> 代 表 对 象 ， 获 取 其 属性 <b> 采 用 <a>.<b>， 
调用 其 方法 <c> 采 用 <a>.<c>0。 对 象 的 方法 具有 程序 功能 性 ， 因 此 采用 函数 形式 封 
装 。 简单 地 , 对象 是 程序 拟 解决 计算 问题 的 一 个 高 级 别 抽象 , 它 包括 一 组 静态 值 ( 属 
性 ) 和 一 组 函数 (方法 )。 从 代码 行 数 角度 来 看 ， 对 象 和 函数 都 使 用 了 一 个 容易 理解 
的 抽象 逻辑 ,但 对 象 可 以 凝聚 更 多 代码 。 因此, 面向 对 象 编程 更 适合 代码 规模 较 大 ， 


FE 
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交互 逻辑 复杂 的 程序 。 

面向 过 程 和 面向 对 象 只 是 编程 方式 不 同 、 抽 象 级 别 不 同 ， 所 有 面向 对 象 编 程 能 
实现 的 功能 采用 面向 过 程 同 样 能 完成 ， 两 者 在 解决 问题 上 不 存在 优 劣 之 分 ， 很 多 专 
业 程 序 员 仅 采用 面向 过 程 方式 编程 ,具体 采用 哪 种 方法 取决 于 具体 开发 环境 和 要 求 ， 
一 般 在 编写 较 大 规模 程序 时 采用 面向 对 象 方法 ， 如 Windows 操作 系统 ， 或 需要 10 
人 或 更 多 人 协同 开发 的 程序 ， 或 带 有 窗口 交互 类 的 程序 。Python 语言 同时 支持 面向 
过 程 和 面向 对 象 两 种 编程 方式 ， 本 书 仅 介绍 但 不 讲解 面向 对 象 编程 。 

当 程 序 的 长 度 在 百 行 以 上 ， 如 果 不 划 分 模块 ， 程 序 的 可 读 性 非常 糟糕 。 解 决 这 
一 问题 的 最 好 方法 是 将 一 个 程序 分 隔 成 短小 的 程序 段 ， 每 一 段 程序 完成 一 个 小 的 功 
能 。 无 论 面 向 过 程 还 是 面向 对 象 编程 ， 对 程序 合理 划分 功能 模块 并 基于 模块 设计 程 
序 是 一 种 常用 方法 ， 被 称 为 “模块 化 设计 ”。 

模块 化 设计 指 通 过 函数 或 对 象 的 封装 功能 将 程序 划分 成 主 程序 、 子 程序 和 子 程 
序 间 关系 的 表达 。 模 块 化 设计 是 使 用 函数 和 对 象 设计 程序 的 思考 方法 ， 以 功能 块 为 
基本 单位 ， 一 般 有 以 下 两 个 基本 要 求 。 

(1) 紧 耦 合 : 尽 可 能 合理 划分 功能 块 ， 功 能 块 内 部 耦合 紧密 。 

(2) 松 耦 合 : 模块 间 关 系 尽 可 能 简单 ， 功 能 块 之 间 耦 合 度 低 。 

使 用 函数 只 是 模块 化 设计 的 必要 非 充分 条 件 ， 根 据 计 算 需 求 合理 划分 函数 十 分 
重要 。 一 般 来 说 ， 完 成 特定 功能 或 被 经 常 复 用 的 一 组 语句 应 该 采用 函数 来 封装 ， 并 
尽 可 能 减少 函数 间 参 数 和 返回 值 的 数量 。 


耦合 和 松 耦 合 


人 耦合 性 指 程序 结构 中 各 模块 之 间 相 互 关联 的 程度 ， 它 取决 于 各 模块 间接 口 的 
' 复杂 程度 和 调用 方式 。 看 合 性 是 影响 软件 复杂 程度 和 设计 质量 的 一 个 重要 因素 。 | 
! 紧 耦 合 指 模块 或 系统 间 关 系 紧密 ， 存 在 较 多 或 复杂 的 相互 调用 。 紧 看 合 的 缺点 在 ， 
于 更 新 一 个 模 所 可 能 将 其 他 模 据 赤 化 ， 复 用 较 国 于 "a 


soy 


对 比 实例 代码 2.1 和 实例 代码 2.3， 尽 管 后 者 通过 函数 封装 增多 了 代码 行 数 ， 但 
采用 drawSnake() 函 数 封装 的 功能 理解 起 来 更 加 容易 。 观 察 实例 代码 7.1， 采 用 函数 
封装 后 ， 理 解 程序 的 第 一 层次 不 再 是 直接 阅读 语句 ， 而 是 阅读 函数 及 其 框架 ， 有 需 
要 时 再 进一步 理解 函数 内 部 语句 。 为 了 增强 代码 可 读 性 , 建议 读者 采用 实例 代码 7.1 
中 的 方式 ， 将 程序 初始 化 或 函数 间 过 滤 语 名 封装 为 main0 函 数 ， 使 得 全 部 代码 都 由 
函数 组 成 ， 最 后 通过 调用 main() 函 数 执行 程序 。 

& 管 函数 和 模块 化 设计 使 整个 程序 看 上 去 篇 幅 更 长 ， 但 所 增加 的 封装 代码 十 分 
有 益 ， 它 们 为 程序 带 来 了 模块 化 的 层次 结构 ， 使 程序 具有 更 好 的 可 读 性 。 


思考 与 练习 
5.16 判断 题 : 使 用 函数 封装 的 程序 一 定 符合 模块 化 设计 原则 。 
5.17 判断 题 ， 使 用 函数 一 定 能 够 简化 程序 理解 ， 没 什么 次 端 。 
5.18 ”思考 松 耦 合 和 紧 耦 合 在 实例 7 中 的 体现 。 
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一 


5.6.1 递归 的 定义 


函数 作为 一 种 代码 封装 ， 可 以 被 其 他 程序 调用 ， 当 然 ， 也 可 以 被 函数 内 部 代码 
调用 。 这 种 函数 定义 中 调用 函数 自身 的 方式 称 为 递归 。 就 像 一 个 人 站 在 装 满 镜子 的 
房间 中 ， 看 到 的 影像 就 是 递归 的 结果 。 递 归 在 数学 和 计算 机 应 用 上 非常 强大 ， 能 够 
非常 简洁 地 解决 重要 问题 。 
数学 上 有 个 经 典 的 递归 例子 叫 阶乘 ， 阶 乘 通常 定义 如 下 : 
n!l= n(n—1)(n— 2).…(]) 
为 了 实现 这 个 程序 , 可 以 通过 一 个 简单 的 循环 累积 去 计算 阶乘 。 观察 5! 的 计算 ， 
如 果 去 掉 了 5， 那么 就 剩 下 计算 41， 推 广 来 看 ，n!=n(n-1)!。 实 际 上 ， 这 个 关系 给 出 
了 另 一 种 表达 阶乘 的 方式 : 
"= n=0 
n(n—l)! otherwise 
这 个 定义 说 明 0 的 阶乘 按 定义 是 1， 其 他 数字 的 阶乘 定义 为 这 个 数字 乘 以 比 这 
个 数字 小 1 数 的 阶乘 。 递 归 不 是 循环 ， 因 为 每 次 递归 都 会 计算 比 它 更 小 数 的 阶乘 ， 
直到 0!。0! 是 已 知 的 值 ， 被 称 为 递归 的 基 例 。 当 递归 到 底 了 ， 就 需要 一 个 能 直接 算 
出 值 的 表达 式 。 
阶乘 的 例子 揭示 了 递归 的 两 个 关键 特征 。 
(1) 存在 一 个 或 多 个 基 例 ， 基 例 不 需要 再 次 递归 ， 它 是 确定 的 表达 式 。 
(2) 所 有 递归 链 要 以 一 个 或 多 个 基 例 结尾 。 


数学 归纳 法 


| 相关 的 全 是 POD 时， 上 学 归纳 法 采用 如 下 步 i 
' (1) 证 明 当 nn 取 第 一 个 值 no 时 命题 成 立 . ' 
' (2) 假设 当 nm (kk>0, kk 为 自然 数 ) 时 命题 成 立 ， 证 明 当 nnerl 时 命题 也 | 


5.6.2 ”递归 的 使 用 方法 


以 阶乘 计算 为 例 ， 可 以 把 阶乘 写成 一 个 单独 的 函数 ， 则 该 函数 如 微 实 例 5.2 中 
第 1 到 第 5 行 所 示 。 
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【 微 实例 5.2】 阶乘 的 计算 。 
根据 用 户 输入 的 整数 nx， 计算 并 输出 n 的 阶乘 值 。 


微 实例 5.2 m5.2CalFactorial. 
def fact/(n): 
if n == 0: 
return 1 
else: 


return n * fact(n-1) 
num = eval (input ("请 输入 一 个 整数 : ")) 
print (fact (abs (int (num) ))) 


~IONOU 必 mm 和 R 咱 


fact(O) 函 数 在 其 定义 内 部 引用 了 自身 ， 形 成 了 递归 过 程 〈 如 第 5 行 )。 无 限制 的 
递归 将 耗 尽 计算 资源 ， 因 此 ， 需 要 设计 基 例 使 得 递归 逐 层 返回 。factO 函 数 通过 证 语 
名 给 出 了 nm 为 0 时 的 基 例 ， 当 n==0，fact() 函 数 不 再 递归 y， 返 回 数值 1， 如 果 n!=0， 
则 通过 递归 返回 n 与 n-1 阶乘 的 乘积 。 

由 于 负数 和 小 数 通过 减 1 无 法 到 达 递 归 的 基 例 Cn==0)， 代 码 第 7 行 通过 abs() 
和 int0 函 数 将 用 户 输入 转变 成 非 负 整数 ， 该 程序 输出 效果 如 下 : 


EE 3 3 


递归 遵循 函数 的 语义 ， 每 次 调用 都 会 引起 新 函数 的 开始 ， 表 示 它 有 本 地 变量 值 
的 副本 ,包括 函数 的 参数 。 图 5.9 给 出 了 计算 5! 的 递归 调用 过 程 , 每 次 函数 调用 时 ， 
函数 参数 的 副本 会 临时 存储 ， 递 归 中 各 函数 再 运算 自己 的 参数 ， 相 互 没 有 影响 。 当 
基 例 结束 运算 并 返回 值 时 ， 各 函数 逐 层 结束 运算 ， 向 调用 者 返回 计算 结果 。 


5 三 到 na 
def fact(n): def fact(n): def fact(n): 
hp if n= 0: 2 if n = 0; A if n= 人 0: 
S return 1 return 1 如 return 1 
else: else: else; 
fact(5) 一 120 return n*fact(n-1) 3 return la return n*fact(n-1) 
= 天 | 
def fact(n): def fact(n): def fact(n): 2 
if n = 0: if n == 0: if n= 0: 
return 1 return 1 return 1 
else: else else: 


return n*fact(n-1) return n*fact{n-1) return n*fact(n-1) 


图 5.9 阶乘 5! 的 递归 调用 过 程 
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使 用 递归 一 定 要 注意 基 例 的 构建 ， 否 则 递归 无 法 返回 将 会 报错 。 

【 微 实例 5.3】 字 符 串 反 转 。 

对 于 用 户 输入 的 字符 串 s， 输 出 反 转 后 的 字符 串 。 

解决 这 个 问题 的 基本 思想 是 把 字符 串 看 作 一 个 递归 对 象 。 长 字符 串 由 较 短 字符 
串 组 成 ， 每 个 小 字符 串 也 是 一 个 对 象 。 假 如 把 一 个 字符 串 看 成 仅 由 两 部 分 组 成 : 首 
字符 和 剩余 字符 串 。 如 果 将 剩余 字符 串 与 首 字符 交换 ， 就 完成 了 反 转 整个 字符 串 ， 
代码 如 下 : 


1 | aef reverse(s) : 
2 return reverse(s[1:]) + s[0] 


观察 这 个 函数 的 工作 过 程 。s[0] 是 首 字符 , s[1:] 是 剩余 字符 串 , 将 它们 反 向 连接 ， 
可 以 得 到 反 转 字符 串 。 执 行 这 个 程序 ， 结 果 如 下 : 


>>>def reverse(s): 
{ return reverse(s[1:]) + s[0] 


>>> reverse ("ABC") 
en 


Wa 和 recursion depth exceeded 


这 个 错误 表明 系统 无 法 执行 reverse0 函 数 创建 的 递归 ， 这 是 因为 reverse() 函 数 
没有 基 例 ， 递 归 层 数 超过 了 系统 允许 的 最 大 递归 深度 。 默 认 情 况 下 ， 当 递归 调用 到 
1 000 层 ，Python 解释 器 将 终止 程序 。 递 归 深 度 是 为 了 防止 无 限 递归 错误 而 设计 的 ， 
当 用 户 编 写 的 正确 递归 程序 需要 超过 1 000 层 时 ， 可 以 通过 如 下 代码 设 定 。 


>>>import sys 


>>>s s.setrecursionlimit (2000) #2000 是 新 的 递归 层 数 


reverse() 超 过 递归 深度 是 因为 没有 设计 基 例 。 字 符 串 反 转 中 的 递归 调用 总 是 使 
用 比 之 前 更 短 的 字符 串 ,， 因 此 ,可 以 把 基 例 设计 为 字符 串 的 最 短 形式 ， 即 空 字符 串 。 
微 实 例 5.3 的 完整 代码 如 下 : 


微 实例 5.3 m5.3ReverseString.py 


def reverse(s): 
if s == "" 
return s 
else: 
return reverse(s[1:]) + s[0] 
str = input ("请 输入 一 个 字符 串 : ") 


Print(reverse (str)) 


-~ DP 


回 


本 
上 


四 
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微 实例 5.3 的 结果 如 下 : 


思考 与 练习 
5.19 下 列 不 是 递归 程序 特点 的 是 (  ”)。 
A. 书写 简单 B. 一 定 要 有 基 例 
C. 执行 效率 高 D. 思路 简单 ， 代 码 不 一 定 容易 理解 


5.20 有 哪些 思路 可 以 构建 递归 的 基 例 ? 
5.21 递归 和 循环 有 什么 区 别 ? 


5.7 实例 8: 科 赫 曲线 绘制 


自然 界 有 很 多 图 形 很 规则 ， 符合 一 定 的 数学 规律， 例如 ， 窗 蜂 妖 窒 是 天 然 的 等 
边 六 角形 等 。 科 赫 (Koch) 曲 线 在 众多 经 典 数 学 曲线 中 非常 著名 , 由 瑞典 数学 家 冯 “ 科 
赫 (H'V'Koch) 于 1904 年 提出 ， 由 于 其 形状 类 似 雪花 ， 也 被 称 为 雪花 曲线 。 

科 赫 曲线 的 基本 概念 和 绘制 方法 如 下 。 

正 整 数 n 代表 科 赫 曲线 的 阶 数 ， 表 示 生 成 科 赫 曲线 过 程 的 操作 次 数 。 科 赫 曲 线 
初始 化 阶 数 为 0， 表 示 一 个 长 度 为 工 的 直线 。 对 于 直线 KL， 将 其 等 分 为 3 段 ， 中 间 
一 段 用 边 长 为 5/3 的 等 边 三 角形 的 两 个 边 替代 ， 得 到 1 阶 科 赫 曲线 ， 它 包含 4 条 线 
段 。 进 一 步 对 每 条 线段 重复 同样 的 操作 后 得 到 2 阶 科 赫 曲线 。 继 续 重 复 同样 的 操作 
于 次 可 以 得 到 款 阶 科 赫 曲线 ， 如 图 5.10 所 示 。 

0 阶 科 赫 曲 线 


二 
RE 


& 
mg 


图 5.10 去 阶 科 赫 曲线 


科 赫 曲线 属于 分 形 儿 何 分 支 ， 它 的 绘制 过 程 体现 了 递归 思想 ,绘制 过 程 代码 如 下 : 


实例 代码 8.1 e8.1DrawKoch.py 

#e8 .1DrawKoch .PY 

p24 import turtle 

3 def koch (size, n): 

4 if n == 

3 turtle.fd(size) 

6 else: 

7 for angle in [0, 60, -120, 60]: 
8 turtle.left (angle) 

9 koch (size/3, n-1) 

10 def main() : 

11 turtle.setup(800,400) 

12 turtle. speed (0) # 控制 绘制 速度 
13 turtle .penup () 

14 turtle.goto(-300, -50) 

15 turtle .pendown () 

16 turtle.pensize (2) 

| koch (600 ,3) # 0 阶 科 赫 曲 线 长 度 ， 阶 数 


18 turtle .hideturtle() 
19 | main() 


n 阶 科 赫 曲线 的 绘制 相当 于 在 画笔 前 进 方向 的 0”、 
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澡 
nh 
划 


60”、-120” 和 60” 分别 


绘制 二 1 阶 曲线 。 实 例 代码 8.1 中 main0) 函 数 设置 了 一 些 初始 参数 ， 如 果 和 希望 控制 
绘制 科 赫 曲线 的 速度 ， 可 以 采用 turtle.speedO 〇 函数 增加 或 减少 速度 。 

科 赫 曲线 从 一 条 直线 绘制 开始 ， 如 果 从 倒置 的 三 角形 开始 将 更 有 趣 。 替 换 实例 
代码 8.1 中 的 main0 函 数 ， 代 码 如 下 。 在 给 定 初 始 图 形 后 ， 通 过 科 赫 曲线 可 以 生成 


很 多 漂亮 的 图 形 ， 如 图 5.11 所 示 ， 请 读者 探索 和 尝试 。 


实例 代码 8.2 e8.2DrawKoch.py 


下 #e8 .2DrawKoch.PY 

2 import turtle 

3 def koch(size, n): 

4 if n == 0: 

S turtle.fdl(size) 

6 else: 

7 for angle in [0, 60, -120, 60]: 
8 turtle.left (angle) 
9 koch (size/3, n-1) 
10 | def main() : 

11 turtle.setup(600,600) 

12 turtle. speed (0) 
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Wc turtle.penup () 

14 turtle.goto(-200,100) 
LY turtle.pendown () 

16 turtle.pensize (2) 

6 level=5 

18 koch (400,1level) 

1 六 turtle.right (120) 
20 koch (400 ,level) 

2 turtle.right (120) 
22 koch (400 ,1level) 

23 turtle.hideturtle() 
24 | main() 


图 5.11 科 赫 曲线 的 雪花 效果 


丘 展 : | 分 形 几何 


! 仅 展示 了 数学 之 美 ， 也 揭示 了 世界 的 本 质 ， 使 人 们 重新 审视 这 个 世界 : 世界 是 非 
' 线性 的 ， 分 形 无 处 不 在 。 


Cas 
CE 


思考 与 练习 

5.22 如何 改变 turtle 绘制 过 程 的 速度 ? 

5.23 ”修改 实例 代码 8.1， 使 科 赫 曲线 反 向 绘制 ， 从 直线 开始 ， 中 间 部 分 向 下 方 
绘制 。 

5.24 ”修改 实例 代码 8.1， 修 改 科 赫 曲线 的 绘制 颜色 。 
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5.8 Python 内 置 函数 


Python 解释 器 提供 了 68 个 内 置 函数 ， 这 些 函 数 不 需 要 引用 库 直 接 使 用 ， 如 表 
5.4 所 示 。 其 中 ， 前 36 个 已 经 或 将 在 本 书 中 出 现 ， 需 要 读者 掌握 。 


表 5.4 ”Python 的 内 置 函 数列 表 〈 共 68 个 ) 
abs0 locals0 
all0 map0 
any0 memoryview0) 
asci0 next0 
bin0 object0 
bool0 property0 
crO re 
complex0 FF setattr() 
dict0 slice0 
divmod() bytes() staticmethod() 
eval0) pow0) delattr() sum() 
floatO super0 
hash0 vars0 
hex0 _impor0__ 


部 分 函数 说 明 如 下 ， 其 他 尚未 遇 到 的 函数 将 在 后 续 章 节 中 介绍 并 使 用 。 

all0 函 数 一 般 针对 组 合 数据 类 型 ， 如 果 其 中 每 个 元 素 都 是 True， 则 返回 True， 
否则 返回 False。 需 要 注意 的 是 ， 整 数 0、 空 字符 串 ""、 空 列表 中 等 都 被 当 作 False。 

any0 函 数 与 all() 函 数 相反 , 只 要 组 合 数据 类 型 中 任何 一 个 是 True, 则 返回 True， 
全 部 元 素 都 是 False 时 返回 False。 

hash() 函 数 对 于 能 够 计算 哈 希 的 类 型 返回 哈 希 值 。 

id0) 函 数 对 每 一 个 数据 返回 唯一 编号 , 数据 不 同 编号 不 同 , 可 以 通过 比较 两 个 变 
量 编号 是 否 相 同 判 断 数 据 是 否 一 致 。Python 将 数据 存储 在 内 存 中 的 地 址 作为 其 唯一 
编号 。 

reversed() 函 数 返 回 输 入 组 合 数据 类 型 的 逆序 形式 。 

sorted() 函 数 对 一 个 序列 进行 排序 ， 默 认 从 小 到 大 排序 。 

type() 函 数 返 回 每 个 数据 对 应 的 类 型 。 

上 述 函 数 的 一 些 实例 如 下 : 


ST on se el | 


a BN 
>>>all(ls) WN a En, de i De 
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ere bi 时 


' Loeb Reference, 
Modules、 ] 


1 
1 
i 
' 
1 
1 
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5.25 请 使 用 typeO 函 数 分 别 对 整数 、 浮 点 数 、 字 符 串 进行 类 型 判断 。 

5.26 请 使 用 len() 函 数 对 整数 、 浮 点 数 、 字 符 串 进行 类 型 长 度 计算 ， 解 释 看 到 
的 结果 。 

5.27 请 使 用 hex0 函 数 分 别 计算 整数 1024、12 800，65 536 的 十 六 进 制 。 


本 章 小 结 


本 章 主要 介绍 了 函数 及 代码 复 用 问题 ， 包 括 函 数 的 定义 、lambda 函数 使 用 、 函 
数 递 归 以 及 参数 的 位 置 和 名 称 传 递 等 内 容 。 本 章 还 介绍 了 datetime 时 间 日 期 库 的 使 
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用 , 并 绘制 了 七 段 数码 管 时 钟 , 讲解 了 如 何 使 用 函数 递归 绘制 复杂 精美 的 科 赫 曲线 。 


程序 练习 题 


5.1 程序 练习 题 3.5 输出 了 一 个 简单 的 田 字 格 ， 用 函数 简化 其 代码 ， 输 出 如 图 


5.12 所 示 的 更 大 田 字 格 。 国光 
中 + 十 二 一 条 
| 
| | | 
+ + + + 四 
| 
| 
| 
sh we = + + 十 一 二 
| 
| 
十 一 + + + + 


图 5.12 更 大 的 田 宇 格 


5.2 ”实现 is0dd0 函 数 ， 参 数 为 整数 ， 如 果 整 数 为 奇数 ， 返 回 True， 否 则 返回 
False。 

5.3 实现 isNum0 函 数 ， 参 数 为 一 个 字符 串 ， 如 果 这 个 字符 串 属于 整数 、 浮 点 
数 或 复数 的 表示 ， 则 返回 True， 否 则 返回 False。 

5.4 实现 multi() 函 数 ， 参 数 个 数 不 限 ， 返 回 所 有 参数 的 乘积 。 

5.5 实现 isPrime() 函 数 ， 参 数 为 整数 ， 要 有 异常 处 理 。 如 果 整 数 是 质数 ， 返 回 
True， 否 则 返回 False。 

5.6 ”使 用 datetime 库 ， 对 自己 的 生日 输出 不 少 于 10 种 日 期 格式 。 

5.7 ” 汉 诺 塔 是 学 习 计 算 机 递归 算法 的 经 典 入 门 案 例 ， 该 案例 来 源 于 真实 故事 。 
在 世界 某 个 地 方 有 一 个 很 虔诚 的 宗教 组 织 ， 其 中 僧侣 维护 着 一 项 神圣 任务 : 保持 宇 
宙 的 时 间 。 在 时 间 的 最 开始 ， 僧 侣 在 平台 上 竖立 了 3 个 垂直 杆 ， 在 最 左 侧 杆 上 有 64 
个 不 同 半 径 的 金色 同心 圆 盘 ， 直 径 较 大 的 圆 盘 堆放 在 下 方 ， 形 成 了 金字 塔 样子 的 整 
体外 观 。 僧 侣 们 的 任务 是 将 所 有 圆 盘 从 最 左 侧 杆 子 移动 到 最 右 侧 杆子 上 ， 这 个 宗教 
认为 当 僧 倡 们 完成 任务 的 时 候 ， 万 事 万 物 将 会 化 为 乌有 ， 宇 宙 将 结束 。 为 了 保持 神 
圣 的 顺序 ， 僧 倡 们 移动 圆 盘 需 要 遵从 特定 的 规则 : 一 次 只 能 移动 一 个 盘子 、 盘 子 只 
在 3 个 标杆 之 间 移 动 、 更 大 的 盘子 不 能 放 在 更 小 的 盘子 上 面 。 图 5.13 给 出 了 汉 诺 
塔 问 题 的 示例 图 ， 其 中 ，3 个 标杆 分 别 用 A、B 和 C 表示。 
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C 


B 


A 
图 5.13” 汉 诺 塔 问题 的 示例 图 


汉 诺 塔 是 一 个 数学 难题 ， 其 问题 描述 为 如 何 将 所 有 圆 盘 从 A 移动 到 C。 请 用 
Python 编写 一 个 汉 诺 塔 的 移动 函数 ， 采 用 递归 方法 解决 这 个 难题 ， 要 求 输入 汉 诺 塔 


的 层 数 ， 输 出 整个 移动 流程 。 


第 6 得 组 合 数据 类 意 


矿 瀑 认 六 雍 人 镶 克 条 ， 历 不 十 作风 蕊 起 。 

Computers are good at following instructions, but not at reading your mind. 

唐纳德 。 克 努 特 (Donald Knuth) 
软件 算法 和 程序 设计 技术 的 先驱 者 

排版 软件 Tex 的 发 明 人 ，《 计 算 机 程序 设计 的 艺术 》 巨 作 的 作者 


! (1) 了解 3 类 基本 组 合 数据 类 型 。 

(2) 理解 列表 概念 并 掌握 Python 中 列表 的 使 用 。 
(3) 理解 字典 概念 并 掌握 Python 中 字典 的 使 用 。 
(4) 运用 列表 管理 采集 的 信息 ， 构 建 数据 结构 。 
(5) 运用 字典 处 理 复 杂 的 数据 信息 。 

《6) 运用 组 合 数据 类 型 进行 文本 词 频 统计 。 


< 2 


A 


在 中 国文 学 史上 ,《 三 国 演 义 》 毫 无 疑问 是 影响 力 最 大 的 小 说 之 一 。 书 中 的 主要 
人 物 家 喻 户 晓 ， 智 慧 的 代言 人 诸葛 亮 、 红 脸 的 关公 和 和 白 脸 的 曹操 …… 这 些 历史 人 物 
的 形象 定位 ， 几 乎 都 来 自 于 《三 国 演 义 》。 该 书 中 数 百 个 棚 棚 如 生 的 角色 ， 究 竟 谁 才 
是 罗贯中 的 主角 ? 有 人 说 是 刘备 ， 有 人 说 是 诸葛 亮 ， 更 多 的 人 则 比较 偏向 曹操 。 
空 口 无 赁 ， 一 起 来 编 个 程序 统计 《三 国 演义 》 人 物 的 出 场次 数 吧 。 
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6.1 组 合 数据 类 型 概述 


计算 机 不 仅 对 单个 变量 表示 的 数据 进行 处 理 ， 更 通常 的 情况 是 ， 计 算 机 需要 对 
一 组 数据 进行 批量 处 理 。 例 如 : 

(1) 给 定 一 组 单词 {python, data, function, list, loop}， 计 算 并 输出 每 个 单词 的 长 度 。 

(2) 给 定 一 个 学 院 的 学 生 信 息 ， 统 计 男 女生 比例 。 

(3) 一 次 实验 产生 了 很 多 组 数据 ， 对 这 些 大 量 数据 进行 分 析 。 

以 单词 统计 问题 为 例 ， 在 计算 一 个 单词 长 度 之 前 ， 程 序 需 要 使 用 一 个 变量 表示 
这 个 单词 ， 对 于 一 组 单词 ， 需 要 很 多 个 变量 。 有 两 个 解决 方案 : 为 每 个 单词 分 配 一 
个 变量 ， 从 变量 命名 上 加 以 区 分 ， 例 如 ，a01、a02 分 别 存储 第 一 个 、 第 二 个 元 素 ; 
或 者 采用 一 个 数据 结构 存储 这 组 数据 ， 对 每 个 元 素 采 用 索引 加 以 区 分 ， 例 如 a 表示 
这 组 元 素 , a[0] 为 该 组 第 一 个 元 素 ,，a[1] 为 第 二 个 元 素 。 两 个 方案 哪个 更 好 呢 ? 显然 ， 
第 二 个 方案 更 好 。 假 定单 词 数量 是 500 个 而 不 是 5 个 ， 使 用 第 一 种 方法 将 是 灾难 。 
此 外 ， 对 每 个 元 素 单 独 定义 变量 ， 不 利于 循环 操作 。 

第 3 章 介绍 了 数字 类 型 ， 包 括 整 数 类 型 、 浮 点 数 类 型 和 复数 类 型 ， 这 些 类 型 仅 
能 表示 一 个 数据 ， 这 种 表示 单一 数据 的 类 型 称 为 基本 数据 类 型 。 然 而 ， 实 际 计算 中 
却 存 在 大 量 同时 处 理 多 个 数据 的 情况 ,这 需要 将 多 个 数据 有 效 组 织 起 来 并 统一 表示 ， 
这 种 能 够 表示 多 个 数据 的 类 型 称 为 组 合 数据 类 型 。 

组 合 数据 类 型 能 够 将 多 个 同类 型 或 不 同类 型 的 数据 组 织 起 来 ， 通 过 单一 的 表示 
使 数据 操作 更 有 序 、 更 容易 。 根 据 数据 之 间 的 关系 ， 组 合 数据 类 型 可 以 分 为 3 类 : 
序列 类 型 、 集 合 类 型 和 映射 类 型 。 

序列 类 型 是 一 个 元 素 向 量 ， 元 素 之 间 存 在 先后 关系 ， 通 过 序号 访问 ， 元 素 之 间 
不 排他 。 

集合 类 型 是 一 个 元 素 集合 ， 元 素 之 间 无 序 ， 相 同 元 素 在 集合 中 唯一 存在 。 

映射 类 型 是 “ 键 - 值 ” 数 据 项 的 组 合 , 每 个 元 素 是 一 个 键 值 对 , 表示 为 (key, value)。 

在 Python 中 , 每 一 类 组 合 数据 类 型 都 对 应 一 个 或 多 个 具体 的 数据 类 型 ,结合 
书 章节 安排 组合 数据 类 型 的 分 类 构成 如 图 6.1 所 示 ， 其 中 加 粗 字 体 表示 Python 支 
持 的 具体 数据 类 型 。 


6.1.1 序列 类 型 


序列 类 型 是 一 维 元 素 向 量 ， 元 素 之 间 存 在 先后 关系 ， 通 过 序号 访问 。 序 列 的 基 
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本 思想 和 表示 方法 均 来 源 于 数学 概念 。 在 数学 中 , 经 常 给 每 个 序列 一 个 名 字 , 例如 ， 
nn 个 数 的 序列 S， 可 以 表示 如 下 : 


S90 By ys a pi 
字符 串 (stm) (3.5 节 ) 
序列 类 型 十 元 组 (tuple) (6.1 节 ) 
列表 (list) (6.2 节 ) 
组 合 数据 类 型 集合 类 型 集合 (set) (6.1 节 ) 
映射 类 型 字典 (map) (6.4 节 ) 


图 6.1 组 合 数据 类 型 的 分 类 和 章节 索引 


当 需 要 访问 序列 中 某 个 特定 值 时 ， 只 需要 通过 下 标 标 出 即 可 。 例 如 ， 需 要 找到 
第 2 个 元 素 ， 即 可 通过 > 获得 。 这 种 采用 集合 名 字 和 下 标 相 结合 的 表示 方法 可 以 简 
洁 地 表示 序列 运算 ， 例 如 ， 对 上 述 序 列 5 求 和 可 以 表示 如 下 : 


$s 
i=0 

由 于 元 素 之 间 存 在 顺序 关系 ,所 以 序列 中 可 以 存在 数值 相同 但 位 置 不 同 的 元 素 。 
序列 类 型 支持 成 员 关 系 操 作 符 〈in)、 长 度 计算 函数 〈len0)、 分 片 〈[])， 元 素 本 身 
也 可 以 是 序列 类 型 。 

Python 语言 中 有 很 多 数据 类 型 都 是 序列 类 型 ， 其 中 比较 重要 的 是 str (字符 串 )、 
tuple( 元 组 ) 和 list〈 列 表 )。 字 符 串 〈str) 可 以 看 成 是 单一 字符 的 有 序 组 合 ， 属 于 
序列 类 型 。 同 时 ， 由 于 字符 串 类 型 十 分 常用 且 单 一 字符 串 只 表达 一 个 含义 ， 也 被 看 
作 是 基本 数据 类 型 。 元 组 是 包含 0 个 或 多 个 数据 项 的 不 可 变 序 列 类 型 。 元 组 生成 后 
是 固定 的 ， 其 中 任何 数据 项 不 能 替换 或 删除 。 列 表 则 是 一 个 可 以 修改 数据 项 的 序列 
类 型 ， 使 用 也 最 灵活 ， 将 在 6.2 节 详 细 介绍 。 无 论 哪 种 具体 数据 类 型 ， 只 要 它 是 序 
列 类 型 ， 都 可 以 使 用 相同 的 索引 体系 ， 即 正 向 递增 序号 和 反 向 递减 序号 ， 如 图 6.2 
所 示 。 


反 向 递减 序号 
_5 -4 -a 2 i 
0 1 必 3 4 
正 向 递减 序号 


图 6.2 序列 类 型 的 索引 体系 


序列 类 型 有 12 个 通用 的 操作 符 和 函数 ， 如 表 6.1 所 示 。 
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表 6.1 序列 类 型 的 通用 操作 符 和 函数 ‘ 共 12 个 ) 


i 7 
xins | 如 果 x 是 s 的 元 素 返回 True， 否则 返回 False 
xnotins 如 果 x 不 是 s 的 元 素 ， 返 回 True， 和 否则 返回 False 
s+t 连接 s 和 ft 
s*n 或 n*s 将 序列 s 复制 n 次 
s[i] 索引 ， 返 回 序列 的 第 i 个 元 素 
s[i:j] 分 片 ， 返 回 包含 序列 s 第 i 到 j 个 元 素 的 子 序 列 (不 包含 第 j 个 元 素 ) 
s[i: j: k] 步骤 分 片 ， 返 回 包含 序列 s 第 i 到 j 个 元 素 以 k 为 步 数 的 子 序列 
len(s) 序列 s 的 元 素 个 数 〈 长 度 ) 
min(s) 序列 s 中 的 最 小 元 素 
max(s) 序列 s 中 的 最 大 元 素 
s.index(x[, i[, j]]) 序列 s 中 从 i 开始 到 j 位 置 中 第 一 次 出 现 元 素 x 的 位 置 
s.count(x) 序列 s 中 出 现 x 的 总 次 数 


元 组 (tuple〉 是 序列 类 型 中 比较 特殊 的 类 型 ， 因 为 它 一 旦 创建 就 不 能 被 修改 。 
元 组 类 型 在 表达 固定 数据 项 、 函 数 多 返回 值 、 多 变量 同步 赋值 、 循 环 遍历 等 情况 下 
十 分 有 用 。Python 中 元 组 采用 逗号 和 圆 括号 〈 可 选 ) 来 表示 ， 例 如 : 


生成 元 组 只 需要 使 用 逗号 将 元 素 隔 离开 即 可 , 例如 上 例 中 的 元 组 creature, 也 可 
以 增加 圆 插 号 ， 但 圆 括号 在 不 混淆 语义 的 情况 下 不 是 必需 的 。 一 个 元 组 可 以 作为 另 
一 个 元 组 的 元 素 ， 可 以 采用 多 级 索引 获取 信息 ， 例 如 元 组 color 中 包含 了 元 组 
creature， 可 以 用 color[-1][2] 获 取 对 应 元 素 值 。 元 组 除了 用 于 表达 固定 数据 项 外 ， 还 
常用 于 如 下 3 种 情况 : 函数 多 返回 值 、 多 变量 同步 赋值 、 循 环 遍 历 ， 例 如 : 


| - 


6.1.2 ”集合 类 型 


集合 类 型 与 数学 中 集合 的 概念 一 致 ， 即 包含 0 个 或 多 个 数据 项 的 无 序 组 合 。 集 
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合 中 的 元 素 不 可 重复 ， 元 素 类 型 只 能 是 固定 数据 类 型 ， 例 如 整数 、 浮 点 数 、 字 符 串 、 
元 组 等 , 列表 、 字 典 和 集合 类 型 本 身 都 是 可 变数 据 类 型 ， 不 能 作为 集合 的 元 素 出 现 。 
Python 编译 器 中 界定 固定 数据 类 型 与 否 主要 考察 类 型 是 否 能 够 进行 哈 希 运算 。 能 够 
进行 哈 希 运 算 的 类 型 都 可 以 作为 集合 元 素 。Python 提供 了 一 种 同名 的 具体 数据 类 


一 mm 一 一 一 一 一 一 一 一 一 一 一 一 一 天 一 一 一 一 人 


J 


Pe 
!' Python 提供 了 一 个 内 置 的 哈 希 运算 函 )， 它 可 以 对 大 
: 个 哈 希 值 ， ile Li Sido CD T 


这 些 哈 希 值 与 哈 希 前 的 内 容 无 关 ， 也 和 这 些 内 容 的 组 合 无 关 。 可 以 说 ， 哈 希 是 
数据 在 另 一 个 数据 维度 的 体现 。 

由 于 集合 是 无 序 组 合 ， 它 没有 索引 和 位 置 的 概念 ， 不 能 分 片 ， 集 合 中 元 素 可 以 
动态 增加 或 删除 。 和 可 以 用 赋值 语句 生成 一 个 集合 ， 例 如 : 


从 上 例 可 以 看 到 ， 由 于 集合 元 素 是 无 序 的 ， 集 合 的 打印 效果 与 定义 顺序 可 以 不 
一 致 。 由 于 集合 元 素 独一无二 ， 使 用 集合 类 型 能 够 过 滤 掉 重复 元 素 。 

set(x) 函 数 可 以 用 于 生成 集合 , 输入 的 参数 可 以 是 任何 组 合 数据 类 型 ， 返回 结果 
是 一 个 无 重复 且 排 序 任意 的 集合 ， 例 如 : 


集合 类 型 有 10 个 操作 符 ， 如 表 6.2 所 示 。 
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表 6.2 ”集合 类 型 的 操作 符 〈 共 10 个 ) 


操 作 符 描 ” 述 
S-T 或 S.difference(T) 返回 一 个 新 集合 , 包括 在 集合 S 中 但 不 在 集合 T 中 的 元 素 
S-=T 或 S.difference_update(T) 更 新 集合 S$， 包括 在 集合 S 中 但 不 在 集合 T 中 的 元 素 
S&T 或 Sintersection(T) 返回 一 个 新 集合 ， 包 括 同时 在 集合 S 和 T 中 的 元 素 


S&=T 或 S.intersection update(T) | 更 新 集合 S， 包 括 同时 在 集合 S 和 T 中 的 元 素 


a 全 人 元 到 后 
S^T 或 s.sSymmetric_difference(T) ee 包括 集合 S 和 T 中 的 元 素 ， 但 不 包括 同 


=^T 或 更 新 集合 S， 包 括 集 合 S 和 T 中 的 元 素 ， 但 不 包括 同时 在 
s.symmetric_difference update(T) | 其 中 的 元 素 

SIT 或 Sunion(T) 返回 一 个 新 集合 ， 包 括 集合 S 和 T 中 的 所 有 元 素 

S=IT 或 S.update(T) 更 新 集合 S， 包 括 集 合 S 和 T 中 的 所 有 元 素 


如 果 $ 与 T 相同 或 $ 是 T 的 子 集 ， 返 回 True， 和 否则 返回 
False， 可 以 用 S<T 判断 S 是 否 是 T 的 真子 集 
如 果 $ 与 相同 或 S 是 T 的 超 集 ， 返 回 True， 否 则 返回 
False， 可 以 用 S>T 判断 S$ 是 否 是 T 的 真 超 集 


S<=T 或 S.issubset(T) 


S>=T 或 S.issuperset(T) 


上 述 操作 符 表达 了 集合 类 型 的 4 种 基本 操作 : 交集 (&)、 并 集 (|)、 差 集 (-)、 
补 集 (^)， 操 作 逻 辑 与 数学 定义 相同 ， 如 图 6.3 所 示 。 


图 6.3 集合 类 型 的 4 种 基本 操作 
集合 类 型 有 10 个 操作 函数 或 方法 ， 如 表 6.3 所 示 。 
表 6.3 ”集合 类 型 的 操作 函数 或 方法 〈 共 10 个 ) 


操作 函数 或 方法 措 王 人 于 珊 
S.add(x) 如 果 数 据 项 x 不 在 集合 S 中 ,将 x 增加 到 s 
S.clear() 移 除 S 中 的 所 有 数据 项 
S.copyO 返回 集合 S 的 一 个 副本 
S.pop() 随机 返回 集合 S 中 的 一 个 元 素 , 如 果 $ 为 空 , 产生 KeyError 异常 
S.discard(x) 如 果 x 在 集合 S 中 ， 移 除 该 元 素 ; 如 果 x 不 在 集合 S 中 ， 不 报错 
S.remove(x) 如 果 x 在 集合 S 中 ， 移 除 该 元 素 ; 不 在 则 产生 KeyError 异常 
S.isdisjoint(T) 如 果 集 合 S 与 T 没 有 相同 元 素 ， 返 回 True 
len(S) 返回 集合 S 的 元 素 个 数 
xinS 如 果 x 是 S 的 元 素 ， 返 回 True， 和 否则 返回 False 
xnotin S 如 果 x 不 是 S 的 元 素 ， 返 回 True， 和 否则 返回 False 


集合 类 型 主要 用 于 3 个 场景 : 成 员 关 系 测试 、 元 素 去 重 和 删除 数据 项 ， 例 如 : 
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集合 类 型 与 其 他 类 型 最 大 的 不 同 在 于 它 不 包含 重复 元 素 ， 因 此 ， 当 需要 对 一 维 
数据 进行 去 重 或 进行 数据 重复 处 理 时 ， 一 般 通过 集合 来 完成 。 


6.1.3 ”映射 类 型 


映射 类 型 是 “ 键 - 值 ” 数 据 项 的 组 合 ， 每 个 元 素 是 一 个 键 值 对 ， 即 元 素 是 (key, 
value)， 元 素 之 间 是 无 序 的 。 键 值 对 (key, value) 是 一 种 二 元 关系 ， 源 于 属性 和 值 的 映 
射 关 系 ， 对 应 实例 如 图 6.4 所 示 。 
红色 
a ee 外 部 颜色 : 红色 
外 部 颜色 蓝 色 内 部 颜色 : 蓝 色 
白色 
图 6.4 映射 关系 和 键 值 对 实例 
键 (key) 表示 一 个 属性 ， 也 可 以 理解 为 一 个 类 别 或 项 目 ， 值 (value) 是 属性 


的 内 容 ， 键 值 对 刻画 了 一 个 属性 和 它 的 值 。 键 值 对 将 映射 关系 结构 化 ， 用 于 存储 和 表 
达 。 在 Python 中， 映射 类 型 主要 以 字典 (dict) 体现 。6.4.1 节 将 进一步 介绍 字典 类 型 。 


思考 与 练习 

6.1 请 比较 元 组 和 集合 的 区 别 ， 思 考 如 何 实 现 元 组 和 集合 的 互相 转换 ? 

6.2 ”两 个 集合 : S1={1,3,5,6}，S2={2,5,6}， 请 计算 S1|IS2、S1&S2、S1^S2 和 
S1-S2 的 值 。 

6.3 思考 序列 、 集 合 和 映射 在 数据 关系 层面 的 含义 。 


6.2 列表 类 型 和 操作 
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6.2.1 列表 类 型 的 概念 


列表 (list) 是 包含 0 个 或 多 个 对 象 引 用 的 有 序 序列 ， 属 于 序列 类 型 。 与 元 组 不 
同 ， 列 表 的 长 度 和 内 容 都 是 可 变 的 ， 可 自由 对 列表 中 的 数据 项 进行 增加 、 删 除 或 蔡 
换 。 列 表 没 有 长 度 限制 ， 元 素 类 型 可 以 不 同 ， 使 用 非常 灵活 。 

由 于 列表 属于 序列 类 型 ， 所 以 列表 也 支持 成 员 关 系 操作 符 (in)、 长 度 计算 函数 
(len())、 分 片 《[])。 列 表 可 以 同时 使 用 正 向 递增 序号 和 反 向 递减 序号 ， 可 以 采用 标 
准 的 比较 操作 符 (<、<=、==、!=、>=、>) 进行 比较 ,列表 的 比较 实际 上 是 单个 数 
据 项 的 逐个 比较 。 

列表 用 中 括号 〈[]) 表示 ， 也 可 以 通过 listO) 函 数 将 元 组 或 字符 串 转 化 成 列表 。 
直接 使 用 listO 函 数 会 返回 一 个 空 列表 ， 例 如 : 


与 整数 和 字符 串 不 同 ， 列表 要 处 理 一 组 数据 ， 因 此 ， 列表 必须 通过 显 式 的 数据 
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赋值 才能 生成 ， 简 单 将 一 个 列表 赋值 给 另 一 个 列表 不 会 生成 新 的 列表 对 象 ， 例 如 : 


5 


生 对 列表 ls 的 一 个 新 的 引用 ， 此 时 ，lt 和 ls 变量 都 是 实际 数据 [425,"BIT"，1024] 的 
表示 或 引用 ， 真 实数 据 只 存储 一 份 ， 因 此 ， 修 改 ls 也 同时 修改 了 tt， 这 个 关系 如 图 
6.5 所 示 。 


>>>1s = [425, "BIT", 1024] 


ls 
>>>1t = 1s ES [425, "BIT" ,1024] 
>>>1s[0] = 0 1t 


>>>1t 0 


图 6.5 列表 对 象 的 创建 和 引用 


6.2.2 列表 类 型 的 操作 


列表 是 序列 类 型 ， 因 此 ， 表 6.1 中 12 个 序列 类 型 的 操作 符 和 函数 都 可 应 用 于 列 
表 类 型 。 由 于 列表 是 可 变 的 ， 表 6.4 给 出 了 列表 类 型 额外 的 14 个 常用 函数 或 方法 。 


表 6.4 列表 类 型 特有 的 函数 或 方法 ( 共 14 个) 


ls[i] = x 替换 列表 ls 第 i 数据 项 为 x 

ls[i: j] = 1t 用 列表 1t 替换 列表 ls 中 第 i 到 第 j 项 数据 (不 含 第 j 项 , 下 同 ) 
ls[i:j: k]=1t 用 列表 1t 替换 列表 ls 中 第 i 到 第 j 项 以 k 为 步 数 的 数据 
del Is[i: j] 删除 列表 ls 第 i 到 第 j 项 数据 ， 等 价 于 1s[i: j]=[] 

del ls[i: j: k] 删除 列表 ls 第 i 到 第 j 项 以 k 为 步 数 的 数据 

ls+=lt 或 ls.extend(lb) 将 列表 lt 元素 增加 到 列表 Is 中 

ls *=n 更 新 列表 ls， 其 元 素 重复 n 次 

ls.append(x) 在 列表 ls 最 后 增加 一 个 元 素 x 

ls.clear() 删除 ls 中 的 所 有 元 素 

ls.copy0) 生成 一 个 新 列表 ， 复 制 ls 中 的 所 有 元 素 

ls.insert(i, x) 在 列表 ls 的 第 i 位 置 增加 元 素 x 

1s.pop(i) 将 列表 ls 中 的 第 i 项 元 素 取出 并 删除 该 元 素 
ls.remove(x) 将 列表 中 出 现 的 第 一 个 元 素 x 删除 


ls.reverse(x) 列表 ls 中 的 元 素 反 转 
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上 述 例 子 中 ，vlist[3] 从 整数 变 成 了 字符 串 ， 子 序列 vlist[1:3] 被 另 一 个 列表 赋值 
修改 。 需 要 注意 的 是 ， 当 使 用 一 个 列表 改变 男 一 个 列表 值 时 ，Python 不 要 求 两 个 列 
表 长 度 一 样 ， 但 遵循 “多 增 少 减 ”的 原则 ， 例 如 : 


| 23 
| > 
| 


vlist[1:3] 子 序列 包含 两 个 元 素 ， 对 其 赋值 时 却 给 了 3 个 元 素 ，Python 接受 这 种 
方式 ， 并 不 会 报错 ，vlist 结果 包含 了 赋值 列表 中 的 多 余 元 素 。 同 样 ， 当 使 用 包含 更 
少 元 素 赋值 列表 时 ， 原 列表 元 素 会 相应 减少 。 可 以 通过 赋 给 更 多 或 更 少 元 素 实现 对 
列表 元 素 的 插入 或 删除 。 

与 元 组 一 样 ， 列 表 可 以 通过 forin 语句 对 其 元 素 进 行 遍 历 ， 基 本 语法 结构 如 下 : 
for < 任意 变量 名 > in < 列表 名 >: 
< 语句 块 > 


列表 是 一 个 十 分 灵活 的 数据 结构 , 它 具 有 处 理 任意 长 度 、 混合 类 型 数据 的 能 力 ， 


-OO 


i 忆 记 条 习 6-1。 并 提供 了 丰富 的 基础 操作 符 和 方法 。 当 程序 需要 使 用 组 合 数据 类 型 管理 批量 数据 时 ， 


Mython ”请 尽量 使 用 列表 类 型 。 


加 如 


思考 与 练习 

6.4 列表 1s=[2,5,7,1,6]， 请 对 列表 按照 升序 和 降序 的 方式 分 别 排列 。 提 示 : 请 
使 用 Python 内 置 函数 。 

6.5 ”列表 1s1=[30,1,2,0]，1s2=[1,21,133]， 请 比较 两 个 列表 。 
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6.6 ”列表 1s1=[1,43]，1s2=ls1，1s1[0]=22， 请 计算 并 思考 两 个 列表 的 运算 结果 。 
6.7 列表 1s=[[2,3,7],[[3,5],25],[0,9]]，len(ls) 值 是 多 少 ? 


6.3 ”实例 9: 基本 统计 值 计算 


[pe 
入 
第 
游 
EA 
全 
李 
宣 


统计 是 计算 科学 、 管 理学 、 社 会 学 、 数 学 等 诸多 领域 的 基本 问题 ， 相 关 问 题 、 
方法 和 技术 组 成 了 一 门 学 科 ， 即 “统计 学 ”。Python 的 列表 数据 结构 能 够 支持 基本 
的 数据 统计 应 用 。 本 节 以 最 简单 的 统计 问题 为 例 ， 求 解 一 组 不 定 长 数据 的 基本 统计 
值 ， 即 平均 值 、 标 准 差 、 中 位 数 。 

一 组 数据 表示 为 S=so, s1,…, sr1， 其 算术 平均 值 、 标 准 差分 别 表示 如 下 : 


7 一 ] 


m=(Ds,)/n 
i=0 


nl 
,入 (> (s 一 771 /7 一 T 
i=0 


中 位 数 指 5 中 所 有 数 按照 从 小 到 大 (或 者 从 大 到 小 ) 顺序 排列 后 ， 处 于 最 中 间 
位 置 的 数据 值 。 如 果 nn 是 奇数 ， 则 序列 8 的 最 中 间 位 置 是 一 个 数据 ， 可 以 表示 为 
sw2(n=0,1,2,…); 如 果 n 是 偶数 ,序列 5 不 存在 一 个 最 中 间 位 置 ， 则 中 位 数 表示 为 最 
中 间 两 个 位 置 数 据 的 平均 值 ， 即 (sz-1ttswz)/2。 例 如 ，(5,2,1,3,4) 的 中 位 数 是 3， 而 
(4,2,1,3) 的 中 位 数 是 (2+3)/2 为 2.5。 这 个 问题 的 IPO 描述 如 下 。 

输入 : 从 用 户 输入 、 文 件 、 网 络 等 途径 获取 一 组 数据 

处 理 : 适当 的 数据 结构 和 算法 

输出 : 平均 值 、 标 准 差 和 中 位 数 

由 于 平均 值 、 标 准 差 和 中 位 数 是 3 个 不 同 的 计算 目标 ， 使 用 函数 方式 编写 计算 
程序 。 定 义 getNum0) 函 数 从 用 户 输 入 获得 数据 ，mean0 函 数 计算 平均 值 ，dev0 函 数 
计算 标准 差 ，median0 函 数 计算 中 位 数 。 由 于 该 问题 不 限制 用 户 输入 数据 的 最 大 个 数 ， 
所 以 ， 使 用 列表 作为 承载 和 存储 数据 的 数据 类 型 。 实 例 代 码 9.1 的 全 部 代码 如 下 : 


实例 代码 9.1 e9.1CalStatistics.py 


#e9.1CalStatistics.PY 
from math import sqrt 
def getNum() : # 获 取 用 户 输入 
nums = [] 
iNumStr = inPut(" 请 输入 数字 (直接 输入 回 车 退出 ) : ") 


while iNumStr != "1": 


JO 人 DW ND -~ 


nums .append (eval (iNumStr)) 


o 
源 代码 6-1 


友信 :十 十 :算计 
本 统计 值 计算 : 
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8 iNumStr = input ("请 输入 数字 (直接 输入 回 车 退出 ) : ") 
| return nums 

10 | def mean (numbers) : # 计 算 平 均值 

I s=0.0 

for num in numbers : 

直 3 sS = S + num 

14 return s / Len (numbers) 

15 | def dev (numbers，mean) : # 计 算 方差 

业 季 sdev = 0.0 

17 for num in numbers: 

18 sdev = sdev + (num - mean)**2 

19 return sqrt(sdev / (len(numbers)-1)) 

20 | def median (numbers): # 计 算 中 位 数 

21 sorted (numbers) 

22 size = len (numbers) 

23 if size 当 2 == 0: 

24 med = (numbers[size//2-1] + numbers[size//2])/2 
25 else: 

26 med = numbers[size//2] 

27 return med 


28 | n= getNum() # 主 体 函数 

29 |m= mean(n) 

30 | print(" 平 均值: {} ,方差 :{: .2} ;中 位 数 :{}.".format (m,\ 
dev (n,m) ,median (n) ) ) 


该 程序 运行 结果 如 下 : 


rd 


程序 整体 从 第 28 行 开始 执行 ， 先 后 调用 getNum()、mean()、dev0O 和 median() 
函数 。 利 用 函数 的 模块 化 设计 能 够 复 用 代码 并 增加 代码 的 可 读 性 。 每 个 函数 内 部 都 
采用 了 简单 的 语句 。 

getNum(0) 函 数 循环 从 控制 台 获 得 用 户 输入 的 数字 ， 当 用 户 按 Enter 键 时 退出 ， 
所 有 数据 保存 在 nums 列表 中 。 列表 nums 初始 化 时 定义 为 空 , 而 后 根据 输入 逐渐 增 
加 其 长 度 。 

mean0) 函 数 用 浮 点 数 s 记录 列表 numbers 求 和 的 结果 。 其 中 ，for 语句 表示 从 列 
表 numbers 中 取出 每 一 个 元 素 ， 将 其 加 到 s 变量 中 ， 直 到 numbers 中 的 最 后 一 个 元 
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素 。 最 后 ， 通 过 return 语句 返回 平均 值 ，len(numbers) 用 于 计算 列表 的 长 度 。 

为 了 计算 标准 差 ， 需 要 知道 数据 的 平均 值 ， 由 于 mean0 函 数 已 经 可 以 计算 平均 
值 ， 将 均值 作为 一 个 参数 输入 标准 差 dev0 函 数 。dev0O 函 数 中 (val)**2 用 于 计算 val 
的 平方 ，sqrt(val) 计 算 val 的 平方 根 。 

根据 中 位 数 的 定义 ， 中 位 数 函 数 median() 首 先 使 用 Python 内 置 函 数 sortedO 〇 对 
列表 numbers 进行 排序 ， 然 后 根据 中 位 数 定义 计算 中 位 数 。 

列表 在 实现 基本 数据 统计 时 发 挥 了 很 重要 的 作用 ， 主 要 表现 在 以 下 3 个 方面 。 

(1) 列表 是 一 个 动态 长 度 的 数据 结构 ， 可 以 根据 需求 增加 或 减少 元 素 。 

(2) 列表 的 一 系列 方法 或 操作 符 为 计算 提供 了 简单 的 元 素 运算 手段 。 

(3) 列表 提供 了 对 每 个 元 素 的 简单 访问 方式 及 所 有 元 素 的 遍历 方式 。 

括 展 四 中 位 数 的 含义 
中 位 数 是 统计 学 中 常用 的 一 个 指标 ， 它 可 以 将 数值 集合 划分 为 相等 的 两 部 ， 
' 分 。 中 位 数 不 受 数列 分 布 的 极 大 或 极 小 值 影响 ， 从 而 在 一 定 程度 上 代表 了 分 布 数 ， 
列 ， 它 也 是 一 种 衡量 集中 趋势 的 方法 。 

根据 国家 统计 局 发 布 的 2016 年 上 半年 主要 经 济 指标 ， 上 半年 全 国 居民 人 均 可 支 ， 
' 配 收 入 11 886 元， 全 国 居民 人 均 可 支配 收入 中 位 数 10 505 元 ， 说 明 全 国 多 于 一 ， 
' 半 的 居民 收入 低 于 平均 值 . } 


Sd 


1 
1 
量 
1 
1 


思考 与 练习 
6.8 请 修改 实例 代码 9.1 中 的 第 21 行 , 使 用 sorted() 函 数 实 现 数据 的 降序 排列 。 
6.9 ”请 在 实例 代码 9.1 中 增加 函数 ， 实 现 最 大 值 、 最 小 值 的 计算 和 输出 。 
6.10 请 阅读 国家 统计 局 发 布 的 某 份 统计 报告 ， 思 考 中 位 数 及 其 他 统计 指标 的 
党 充 。 


6.4 字典 类 型 和 操作 


: 要 腥 ; 字典 是 包含 0 个 或 多 个 键 值 对 的 集合 ， 没 有 长 度 限 制 ， 可 以 根据 键 
| 索引 值 的 内 容 。 


Vo 


6.4.1 字典 类 型 的 概念 


列表 是 存储 和 检索 数据 的 有 序 序列 。 当 访问 列表 中 的 元 素 时 ， 可 以 通过 整数 的 
索引 来 查找 它 ， 这 个 索引 是 元 素 在 列表 中 的 序号 ， 列 表 的 索引 模式 是 “< 整数 序号 > 
查找 < 被 索引 内 容 >”。 

很 多 应 用 程序 需要 更 灵活 的 信息 查找 方式 ， 例 如 ， 在 检索 学 生 或 员工 信息 时 ， 
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需要 基于 身份 证 号 码 进 行 查找 ， 而 不 是 信息 存储 的 序号 。 在 编程 术语 中 ， 根 据 一 个 
信息 查找 另 一 个 信息 的 方式 构成 了 “ 键 值 对 ”, 它 表 示 索 引用 的 键 和 对 应 的 值 构成 的 
成 对 关系 ， 即 通过 一 个 特定 的 键 (身份 证 号 码 ) 来 访问 值 (学 生 信息 )。 实 际 应 用 中 
有 很 多 “ 键 值 对 ”的 例子 ， 例 如 ， 姓 名 和 电话 号 码 、 用 户 名 和 密码 、 邮 政 编 码 和 运 
输 成 本 、 国 家 名 称 和 首都 等 。 由 于 键 不 是 序号 ， 无 法 使 用 列表 类 型 进行 有 效 存储 和 
索引 。 

通过 任意 键 信息 查找 一 组 数据 中 值 信息 的 过 程 叫 映射 ， Python 语言 中 通过 字典 
实现 映射 。Python 语言 中 的 字典 可 以 通过 大 括号 ({) 建立 ， 建 立 模式 如 下 : 

{< 键 1>:< 值 1>，< 键 2>:< 值 2>，... ，< 键 n>:< 值 n>} 

其 中 ， 键 和 值 通过 冒号 连接 ,不同 键 值 对 通过 有 逗号 隔 开 。 从 Python 设计 角度 考 
虑 ， 由 于 大 括号 人 } 可 以 表示 集合， 因此 字典 类 型 也 具有 和 和 集合 类 似 的 性 质 ， 即 键 值 
对 之 间 没 有 顺序 且 不 能 重复 。 简 单 说 ， 可 以 把 字典 看 成 元 素 是 键 值 对 的 集合 。 下 面 
a rhe: dy es phi 


注意 到 ， 字 典 打 印 出 来 的 顺序 与 创建 之 初 的 顺序 不 同 ， 这 不 是 错误 。 字 和 典 是 集 
合 类 型 的 延续 ,所 以 各 个 元 素 并 没有 顺序 之 分 。 如 果 想 保持 一 个 集合 中 元 素 的 顺序 ， 
需要 使 用 列表 ， 而 不 是 字典 。 

字典 最 主要 的 用 法 是 查找 与 特定 键 相 对 应 的 值 , 这 通过 索引 符号 来 实现 。 例如 : 


一 般 来 说 ， 字 典 中 键 值 对 的 访问 模式 如 下 ， 采 用 中 括号 格式 : 
< 值 > = < 字典 变量 > [< 键 >] 
字典 中 对 某 个 键 值 的 修改 可 以 通过 中 括号 的 访问 和 赋值 实现 ， 例 如 : 


总 结 起 来 ， 字 典 是 存储 可 变数 量 键 值 对 的 数据 结构 ， 键 和 值 可 以 是 任意 数据 类 
型 ， Esc 甚至 可 以 存储 几 十 万 项 内 容 。 


oe 重出， me i 到 Ch 
,Python 语言 中 ， 字 符 囊 、 列 表 、 元 组 等 都 采用 数字 索引 ， 字 典 采 用 字符 


Vo = A 
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6.4.2 ”字典 类 型 的 操作 


与 列表 相似 , Python 字典 也 有 非常 灵活 的 操作 方法 。 使 用 大 括号 可 以 创建 字典 ， 
并 指定 初始 值 ， 通 过 中 括号 可 以 增加 新 的 元 素 ， 例 如 : 


直接 使 用 大 括号 ( 匀 ) 可 以 创建 一 个 空 的 字典 ， 并 通过 中 括号 《0D) 向 其 增加 
元 素 ， 例 如 : 


需要 注意 的 是 ， 尽 管 集合 类 型 也 用 大 括号 表示 ， 直 接 使 用 大 括号 ({}〉 生 成 一 
个 空 的 字典 ， 而 不 是 集合 。 生 成 空 集合 需要 使 用 函数 set()。 

字典 在 Python 内 部 也 已 采用 面向 对 象 方式 实现 ， 因 此 也 有 一 些 对 应 的 方法 , 采 
用 <a>.<b>0 格 式 , 此 外 , 还 有 一 些 函 数 能 够 用 于 操作 字典 , 这 些 函 数 和 方法 如 表 6.5 


所 示 。 
和 6.5 ec pc 阳 Ea 9 这 


0 i 
<d>. ea 返回 所 有 的 键 信息 

<d>.values() 返回 所 有 的 值 信息 

<d>.items() 返回 所 有 的 键 值 对 

<d>.get(<key>,<default>) 键 存 在 则 返回 相应 值 ， 否 则 返回 默认 值 
<d>.pop(<key>,<default>) 键 存在 则 返回 相应 值 ， 同 时 删除 键 值 对 ， 否 则 返回 默认 值 
<d>.popitem() 随机 从 字典 中 取出 一 个 键 值 对 ， 以 元 组 (key, value) 形 式 返回 
<d>.clear() 删除 所 有 的 键 值 对 

del <d>[<key>] 删除 字典 中 某 一 个 键 值 对 

<key> in <d> 如 果 键 在 字典 中 则 返回 Trme， 否 则 返回 False 


上 述 方法 的 一 些 例子 如 下 ， 如 果 和 希望 keys()、values() 和 items() 方 法 返回 列表 类 
型 ， 可 以 采用 list0 函 数 将 返回 值 转换 成 列表 。 
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与 其 他 组 合 类 型 一 样 ， 字 典 可 以 通过 forin 语句 对 其 元 素 进 行 遍历 ， 基 本 语法 
结构 如 下 : 
for < 变量 名 > in < 字典 名 >: 
< 语句 块 > 
由 于 键 值 对 中 的 键 相当 于 索引 ， 因 此 ，for 循环 返回 的 变量 名 是 字典 的 索引 值 。 
如 果 需 要 获得 键 对 应 的 值 ， 可 以 在 语句 块 中 通过 get() 方 法 获得 。 


字典 是 实现 键 值 对 映射 的 数据 结构 ， 它 采用 固定 数据 类 型 的 键 数据 作为 索引 ， 
十 分 灵活 ， 具 有 处 理 任意 长 度 、 混 合 类 型 键 值 对 的 能 力 。 为 了 更 好 地 认识 和 使 用 字 

-oo ”。 。 典 ,请 理解 如 下 一 些 基本 原则 。 

> mn = 向 。 《1) 字典 是 一 个 键 值 对 的 集合 ， 该 集合 以 键 为 索引 ， 一 个 键 信息 只 对 应 一 个 什 

小 测验 言 已 。 

ee 

(3) 字典 长 度 是 可 变 的 ， 可 以 通过 对 键 信息 赋值 实现 增加 或 修改 键 值 对 。 


思考 与 练习 
6.11 判断 题 ， 在 字典 里 ， 同 一 个 键 可 以 对 应 两 个 或 多 个 值 。 
~ 6.12 字典 D={" 张 三 "88," 李 四 "90," 王 五 "73," 赵 六 ":82}， 写 出 下 列 操作 的 


学 小 时 学 Python 代码 。 
字 (1) 向 字典 中 添加 键 值 对 “" 钱 七 ":90”。 
(2) 修改 " 王 五 "对 应 的 值 为 93。 
(3) 删除 " 赵 六 "对 应 的 键 值 对 。 
6.13 ”下面 是 正确 的 字典 创建 方式 的 是 〈 对 
A. d={1:[1,2],3:[3,4]} B, d={[1,2]:1,[3,4]:3} 
C. d={(1,2):1,(3,4):3} D; df " 张 三 "3! 这 四 "中 
E. d={" 张 三 “1 "要 四 "33 
6.14 对 于 字典 d=f"abe":1, "qwe":3, "Zzxc":2}，len(d) 的 结果 是 多 少 ? 
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6.5 模块 4: jieba 库 的 使 用 


te Ee 


6.5.1 jieba 库 概述 


对 于 一 段 英文 文本 ， 例 如 "China is a great country"， 如 果 希 望 提取 其 中 的 单词 ， 
只 需要 使 用 字符 串 处 理 的 split() 方 法 即 可 ， 例 如 : 


然而 ， 对 于 一 段 中文 文 本 ， 例 如 ，" 中 国 是 一 个 伟大 的 国家 "， 获 得 其 中 的 单词 
(不 是 字符 ) 十 分 困难 ， 因 为 英文 文本 可 以 通过 空格 或 者 标点 符号 分 隔 ， 而 中 文 单词 
之 间 缺 少 分 隔 符 ， 这 是 中 文 及 类 似 语 言 独 有 的 “分 词 ”问题 。 上 例 中 ， 分 词 能 够 将 
"中 国 是 一 个 伟大 的 国家 "分 为 "中 国 " "是 "、" 一 个 "、" 伟 大 "、" 的 "、" 国 家 "等 一 系 
列 词语 。 

jieba (“结巴 ”) 是 Python 中 一 个 重要 的 第 三 方 中 文 分 词 函 数 库 ， 例 如 : 


jieba 库 是 第 三 方 库 , 不 是 Python 安装 包 自 带 的 , 因此 , 需要 通过 pip 指令 安装 ， 
具体 安装 方法 请 参考 8.6 节 。pip 安装 命令 如 下 : 


jieba 库 的 分 词 原理 是 利用 一 个 中 文 词 库 ， 将 待 分 词 的 内 容 与 分 词 词 库 进行 比 
对 ， 通 过 图 结构 和 动态 规划 方法 找到 最 大 概率 的 词组 。 除 了 分 词 ，jieba 还 提供 增加 
自 定 义 中 文 单词 的 功能 。 

jieba 库 支持 3 种 分 词 模式 ;精确 模式 ， 将 句子 最 精确 地 切 开 ， 适 合 文本 分 析 ; 
全 模式 ， 把 句子 中 所 有 可 以 成 词 的 词语 都 扫描 出 来 ， 速 度 非常 快 ， 但 是 不 能 消除 歧 。 


义 ; 搜索 引擎 模式 ， 在 精确 模式 的 基础 上 ， 对 长 词 再 次 切 分 ， 提 高 召回 率 ， 适 合用 
于 搜索 引擎 分 词 。 


6.5.2 jieba 库 解 析 


jieba 库 主 要 提供 分 词 功能 , 可 以 辅助 自 定义 分 词 词典 。jieba 库 中 包含 的 主要 函 


Gren, 
图 片 资料 6-1: | 
Python 快速 参考 | 
之 random、jieba、 

datetime 库 | 
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数 如 表 6.6 所 示 。 

雪 &6 Pe dd oleae ( 共 7 个 ) 
jieba.cut(s) 精确 神 式 ， 运 回 一 个 可 达 代 的 数据 类型 
jieba.cut(s, cut_all=True) 全 模式 ， 输 出 文本 s 中 所 有 可 能 的 单词 
jieba.cut for_ search(s) 搜索 引擎 模式 ， 适 合 搜索 引擎 建立 索引 的 分 词 结果 
jieba.lcut(s) 精确 模式 ， 返 回 一 个 列表 类 型 ， 建 议 使 用 
jieba.lcut(s, cut_all=True) 全 模式 ， 返 回 一 个 列表 类 型 ， 建 议 使 用 
jieba.leut for search(s) 搜索 引擎 模式 ， 返 回 一 个 列表 类 型 ， 建 议 使 用 
jieba.add word(w) 向 分 词 词典 中 增加 新 词 w 


Will 举例 如 下 : 


jieba.lcutO 函 数 返回 精确 模式 ， 输 出 的 分 词 能 够 完整 且 不 多 余地 组 成 原始 文本 ; 
jieba.lcut(True) 函 数 返回 全 模式 ,输出 原始 文本 中 可 能 产生 的 所 有 问题 ,元 余 性 最 大 ; 
jieba.lcut for searchO 函 数 返 回 搜索 引擎 模式 ， 该 模式 首先 执行 精确 模式 ， 然 后 再 对 
其 中 的 长 词 进一步 切 分 获得 结果 。 由 于 列表 类 型 通用 且 灵 活 ， 建 议 读者 使 用 上 述 3 
个 能 够 返回 列表 类 型 的 分 词 函数 。 

默认 情况 下 ， 表 6.6 中 的 jieba.cut0 等 6 个 分 词 函数 能 够 较 高 概率 识别 自 定义 的 
新 站， 比如 名 字 或 缩写 ， 例 如 ， 下 例 中 本 书 作 者 的 姓名 不 在 词典 中 ， 但 分 词 函数 能 
够 根据 中 文字 符 间 的 相关 性 识别 为 一 个 词 。 对 于 无 法 识别 的 分 词 ， 也 可 以 通过 
jieba.add_ word0 函 数 向 分 词 库 添加 ， 例 如 : 


jieba 库 还 有 更 丰富 的 分 词 功 能 , 这 涉及 自然 语言 处 理 领域 , 本 节 不 再 深入 介绍 。 
掌握 表 6.6 中 7 个 分 词 函数 能 够 处 理 绝 大 部 分 与 中 文 文本 相关 的 分 词 问题 。 
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” Python 语言 的 第 三 方 详 指 不 在 Python 安装 包 中 的 函数 库 ， 也 是 非 标准 函数 ， 
库 。 这 类 函数 库 一 般 由 全 球 各 领域 专业 人 士 结合 专业 特点 和 兴趣 开发 。 Python 语 ， 
言 构建 了 一 个 开放 和 自由 的 生态 环境 ， 对 第 三 方 库 的 开发 没有 强制 要 求 ， 因 此 ， 
Python 语言 的 第 三 方 库 发 展 十 分 迅速 。 堆 至 2016 年 9 月 ，Python 官方 网 站 注册 ; 
的 第 三 方 库 已 经 达到 9 万 多 个 . 如 果 说 强大 的 标准 库 黄 定 了 Python 语言 发 展 的 基 ， 


PR 
NA 


些 稳定 的 第 三 方 库 不 断 被 加 入 标准 库 。 
思考 与 练习 


6.15 ”如 何在 程序 中 引用 jieba 库 ? 

6.16 使 用 jieba.cut0 对 “中 华人 民 共 和 国 是 一 个 伟大 的 国家 ”进行 分 词 ， 输 出 
结果 ， 并 将 该 迭代 器 转换 为 列表 类 型 。 

6.17 ”和 癌 分 词 词 典 中 加 入 一 些 新 的 网 络 用 语 ， 并 编写 例子 观察 分 词 效果 。 


6.6 ”实例 10: 文本 词 频 统计 


在 很 多 情况 下 ， 会 遇 到 这 样 的 问题 : 对 于 一 篇 给 定 文章 ， 希 望 统 计 其 中 多 次 出 
现 的 词语 ， 进 而 概要 分 析 文 章 的 内 容 。 在 对 网 络 信息 进行 自动 检索 和 归档 时 ， 也 会 
遇 到 同样 的 问题 。 这 就 是 “ 词 频 统 计 ” 问 题 。 

从 思路 上 看 ， 词 频 统计 只 是 累加 问题 ， 即 对 文档 中 每 个 词 设计 一 个 计数 器 ， 词 
语 每 出 现 一 次 ， 相 关 计 数 器 加 1。 如 果 以 词语 为 键 ， 计 数 器 为 值 ， 构 成 < 单词 >:< 出 
现 次 数 > 的 键 值 对 ， 将 很 好 地 解决 该 问题 。 这 就 是 字典 类 型 的 优势 。 

下 面 ， 采 用 字典 来 解决 词 频 统计 问题 。 该 问题 的 了 PO 描述 如 下 。 

输入 : 从 文件 中 读 取 一 篇 文章 

处 理 : 采用 字典 数据 结构 统计 词语 出 现 频率 

输出 : 文章 中 最 常 出 现 的 10 个 单词 及 出 现 次 数 

英文 文本 以 空格 或 标点 符号 来 分 隔 词语 ， 获 得 单词 并 统计 数量 相对 容易 ，6.6.1 
节 介绍 统计 英文 文本 词 频 的 方法 。 中 文字 符 之 间 没 有 天 然 的 分 隔 符 ， 需 要 对 中 文 文 
本 进行 分 词 ，6.6.2 节 介 绍 统计 中 文 文本 词 频 方法 。 


6.6.1 Hamlet 英文 词 频 统计 


Hamlet 《哈姆雷特 》 是 莎士比亚 的 一 部 经 典 斐 剧 作品 ， 讲 述 了 克 劳 狄 斯 叔叔 
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谋害 哈姆雷特 父亲 并 算 取 王位 \ 哈 姆 雷 特 流浪 在 外 并 向 叔叔 复仇 的 故事 《哈姆雷特 》 
也 叫 《 王 子 复仇 记 》, 代表 着 整个 西方 文艺 复兴 时 期 文学 的 最 高 成 就 , 很 多 国内 外 电 
影 都 以 这 个 故事 为 原型 。 

获取 该 故事 的 文本 文件 ,保存 为 hamlet.txt。 全 文 可 以 从 网 络 上 找到 , 或 从 本 书 
提供 的 电子 资源 中 获取 。 

统计 Hamlet 英文 词 频 的 第 一 步 是 分 解 并 提取 英文 文章 的 单词 .同一 个 单词 会 存 
在 大 小 写 不 同形 式 ， 但 计数 却 不 能 区 分 大 小 写 。 假 设 Hamlet 文本 由 变量 txt 表示 ， 
可 以 通过 txt.lower0 函 数 将 字母 变 成 小 写 ， 排 除 原 文大 小 写 差 异 对 词 频 统计 的 干扰 。 
英文 单词 的 分 隔 可 以 是 空格 、 标 点 符号 或 者 特殊 符号 。 为 统一 分 隔 方式 ， 可 以 将 各 
种 特殊 字符 和 标点 符号 使 用 txt. replace() 方 法 替换 成 空格 ， 再 提取 单词 。 

统计 词 频 的 第 二 步 是 对 每 个 单词 进行 计数 。 假 设 将 单词 保存 在 变量 word 中 ， 
使 用 一 个 字典 类 型 counts={}， 统 计 单 词 出 现 的 次 数 可 采用 如 下 代码 : 

counts[word] = counts[word] + 1 

当 遇 到 一 个 新 词 时 , 单词 没有 出 现在 字典 结构 中 , 则 需要 在 字典 中 新 建 键 值 对 : 

counts[new word] = 1 

因此 , 无 论 词 是 否 在 字典 中 , 加 入 字典 counts 中 的 处 理 逻 辑 可 以 统一 表示 如 下 : 

if word in counts: 

counts[word] = counts[word] + 1 
else: 
counts[lword] = 1 

或 者 ， 这 个 处 理 逻 辑 可 以 更 简洁 地 表示 为 如 下 代码 : 

counts[word] = Counts .get (word,0) + 1 

字典 类 型 的 counts.get(word,0) 方 法 表示 : 如 果 word 在 counts 中 ， 则 返回 word 
对 应 的 值 ， 如 果 word 不 在 counts 中 ， 则 返回 0。 

该 实例 的 第 三 步 是 对 单词 的 统计 值 从 高 到 低 进 行 排序 ， 输 出 前 20 个 高 频 词 语 ， 
并 格式 化 打印 输出 。 由 于 字典 类 型 没有 顺序 ， 需 要 将 其 转换 为 有 顺序 的 列表 类 型 ， 
再 使 用 sort0 方 法 和 lambda 函数 配合 实现 根据 单词 出 现 的 次 数 对 元 素 进行 排序 。 最 
后 输出 排序 结果 前 10 位 的 单词 。 

items = list(counts.items()) # 将 字典 转换 为 记录 列表 

items.sort (key=lambda x:x[1]，reverse=True)# 以 记录 第 2 列 排序 


采用 函数 对 获取 和 整理 文本 进行 封装 ， 下 面 给 出 该 实例 的 完整 代码 。 


实例 代码 10.1 el10.1CalHamlet.py 


#e10.1CalHamlet .py 
def getText (): 
txt = open("hamlet.txt", "r") .read() 
txt = txt.lower() 
for ch in '!"#$%g()*+,-./:;<=>?@[\\]^_‘\{1}~': 
txt = txt.replace(ch, " ")  # 将 文本 中 特殊 字符 替换 为 空格 
return txt 
hamletTxt = getText() 


DAA 人 WN 
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9 words = hamletTxt.split!() 
10 | counts = {} 
11 | for word in words: 
12 counts[word] = counts.get(word,0) + 1 
13 | items = 1List(counts .Items ()) 
14 | items.sort(key=lambda x:x[1], reverse=True) 
15 | for i in range(10): 
16 word, count = items[i] 
注 邹 Print ("{0:<10}{1:>5}".format (word, count)) 


运行 程序 后 ， 输 出 结果 如 下 : 


观察 输出 结果 可 以 看 到 ,高 频 单词 大 多 数 是 冠 词 、 代 词 、 连 接 词 等 语法 型 词汇 ， 
并 不 能 代表 文章 的 含义 。 进 一 步 地 ， 可 以 采用 集合 类 型 构建 一 个 排除 词汇 库 


excludes， 在 输出 结果 中 排除 这 个 词汇 库 中 的 内 容 ， 具 备 这 样 功能 程序 的 完整 代码 
如 下 : 


实例 代码 10.2 e€10.2CalHamilet.py 


1 | #el0.2CalHamlet.PY 

之 excludes = {"the","and","of","you","a","i","my","in"} 
3 def getText() : 

4 txt = open("hamlet.txt", "r") .read() 

3 txt = txt.lower() 

6 for ch in '!I"#$%&()*+,-./:;<=>?@[\\I^_‘{1}~': 

txt = txt.replace(ch, " ")  # 将 文本 中 特殊 字符 替换 为 空格 
8 return txt 

9 hamletTxt = getText() 

10 | words = hamletTxt.split() 

TI1 | counts = {} 

12 | for word in words: 

3 counts[word] = counts.get(word,0) + 1 

14 | for word in excludes: 
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15 del (counts [word]) 

16 | items = list(counts.items()) 

17 | items.sort(key=lambda x:x[1], reverse=True) 

18 | for i in range(10): 

19 word, count = items[i] 

20 print ("{0:<10}{1:>5}".format (word, count)) 


运行 程序 后 ， 输 出 结果 如 下 : 


再 次 输出 仍然 发 现 了 很 多 语法 型 词汇 ， 如 果 希 望 排 除 更 多 的 词汇 ， 可 以 继续 增 
加 excludes 中 的 内 容 ， 请 感 兴趣 的 读者 逐步 完善 这 个 程序 功能 。 


6.6.2 《三 国 演义 》 人 物 出 场 统计 


i 《三 国 演义 》 是 中 国 古典 四 大 名 著 之 一 ,作者 是 元 末 明 初 的 小 说 家 罗贯中 。 该 书 
三国 演 义 文本 ”描写 了 从 东汉 末年 到 西晋 初 年 之 间 近 105 年 的 历史 风云 ， 以 描写 战争 为 主 ， 反 映 了 
“7 东汉 末年 的 群雄 割据 混战 和 魏 、 境 、 吴 三 国之 间 的 政治 和 军事 斗争 。 
《三 国 演义 》 是 一 本 鸿 篇 巨著 , 里 面 出 现 了 几 百 个 各 具 特 色 的 人 物 。 每 次 读 这 本 
经 典 作品 都 会 想 一 个 问题 , 全 书 这 些 人 物 谁 出 场 最 多 呢 ? 一 起 来 用 Python 回答 这 个 
i 源码 5-4， 。。 同 题 吧 。 


re 人 物 出 场 统计 涉及 对 词汇 的 统计 。 中 文 文章 需要 分 词 才能 进行 词 频 统计 ， 这 需 
。 要 用 到 jieba 库 。 分词 后 的 词 频 统 计 方法 与 Hamlet 的 英文 词 顷 统计 方法 类 似 。( 三 


#e10 .3CalThreeKingdoms .py 

import jieba 

txt = open ("三 国 演义 .txt", "r", encoding='utf-8') .read() 
words = jieba.lcut(txt) 

counts = {} 


WD Pp 
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6 for word in words: 

邓 if len(word) == 1: # 排 除 单个 字符 的 分 词 结果 
8 continue 

9 else: 

10 counts[word] = counts.get(word,0) + 1 


11 | items = listl(counts.items()) 

12 | items.sort(key=lambda x:x[1], reverse=True) 

13 | for i in range(15): 

14 word, count = items[i] 

215 print ("{0:<10}{1:>5}".format (word, count)) 


先 输出 排序 前 15 的 单词 ， 运 行程 序 后 ， 输 出 结果 如 下 : 


观察 输出 结果 ， 似 乎 “ 曾 操 ”是 出 场次 数 最 多 的 人 。 然 而 ， 结 果 中 出 现 了 “ 玄 。 0s。 
德 "“ 玄 德 日 ”读者 应 该 知道 “ 玄 德 ”就 是 “刘备 ”。 同一 个 人 物 会 有 不 同 的 名 字 ， ”= 国 演义 中 文人 
这 种 情况 需要 整合 处 理 。 同 时 ， 与 英文 词 频 统计 类 似 ， 要 排除 一 牛人 各 无 关 多 名 沁 频 统计 


汇 ， 如 “却说 ” “将 军 ” 等 。 进 一 步 完 善 代码 如 下 ， 其 中 ， 第 3 行 增加 了 排除 词 库 回 回 
excludes， 第 10 到 第 17 行 增加 了 同一 人 物 不 同名 字 的 处 理 。 


实例 代码 10.4 


e10.4CalThreeKingdoms. 


#e10.4CalThreeKingdoms .py 

import jieba 

excludes = {" 将 军 ", "却说", "荆州 ", "二 人 ", "不 可", "不 能 ", "如 此 "} 
txt = open(" 三 国 演义 .txt", "r", encoding='utf-8') .read() 
words = jieba.lcut (txt) 

counts = {} 

for word in words: 


ODP 
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8 if len (wordq) == 1: 

9 continue 

10 elif word == "诸葛 亮 " or word == "孔明 日 ": 
11 rword = "孔明 " 

12 elif word == "关公 " or word == " 云 长 ": 
13 rword = "关羽 " 

14 elif word == " 文 德 " or word == " 文 德 日 ": 
15 zword = "刘备 " 

16 elif word == " 备 德 " or word == "不 相 " : 
17 rword = "曹操 " 

18 else: 

19 rword = word 

20 counts[rword] = counts.get(rword,0) + 1 
21 | for word in excludes: 

22 del (counts [word]) 


23 | items = list(counts.items()) 

24 | items.sort(key=lambda x:x[1], reverse=True) 

25 | for i in range (5): 

26 word, count = items[i] 

2 print ("{0:<10}{1:>5}".format (word, count)) 


输出 排序 前 5 的 单词 ， 运 行程 序 后 ， 输 出 结果 如 下 : 


由 此 可 以 获得 结论 ,“ 曹 操 ”^“ 和 孔明 ”和 “刘备 ”是 《三 国 演义 》 中 出 场次 数 最 
多 的 人 ， 他 们 之 间 的 出 场次 数 不 相 上 下 ， 随 后 是 “关羽 ”和 “ 张 飞 ”。 请 感 兴趣 的 读 
者 继续 完善 程序 ， 排 除 更 多 无 关 词 汇 干扰 ， 总 结 出 场 最 多 的 20 个 人 物 。 这 里 给 出 参 
考 答案 。 

曹操 (1451)、 了 和 孔明 (1383)、 刘 备 《1252)、 关 羽 (784)、 张 飞 (358)、 

吕布 (300)、 赵 云 (278)、 和 孙权 (264)、 司 马 壹 (221)、 周 瑜 (217)、 

袁绍 (191)、 马 超 (185)、 魏 延 (180)、 黄 忠 (168)、 姜 维 (151)、 

马 岱 〈127)、 庞 德 〈122)、 重 获 (122)、 刘 表 〈120)、 夏 侯 昼 〈116) 


拓展 : 自然 语言 处 理 
， 自然 语言 处 理 是 计算 机 科学 领域 与 人 的 方向 。 
太守 人 与 计算 机 之 间 用 自然 放 行 有 效 通信 的 理论 和 方法 。 自 人 千言 处 理 是 一 
; 门 融 语言 学 、 计 算 机 科学 、 数 学 于 一 体 的 科学 ， 自 然 语言 rhe J 数 


:民族 语言 、 中 文 和 各 种 外 国语 言 都 有 独特 的 自然 语言 处 理 方法 | 


= 一 一 一 一 一 一 一 一 一 一 一 一 二 二 二 一 一 一 一 一 一 一 一 一 一 二 一 二 一 = 一 = 一 二 =- 二 = 一 二 一 二 = 一 -一 一 一 ~- 一 一 一 ~- 一 ~ 一 -~ 一 -~ 一 -一 一 -一 ~ 一 一 一 
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思考 与 练习 
6.18 理解 实例 代码 10.1 列表 排序 中 调用 lambda 函数 的 使 用 。 
6.19 ”程序 中 哪 段 代码 实现 了 将 字典 转换 为 列表 ? 


yy 


6.7 实例 11: Python 之 


源 代 码 6-6: 
) “Python 之 禅 


) 
) 
a 
' 


什么 样 的 程序 是 好 的 ? 如 何 编写 漂亮 的 代码 ?这 是 学 习 编 程 一 段 时 间 最 经 常 提 
出 的 问题 ， 却 最 难 回答 。 程序 设计 语言 如 同 自然 语言 一 样 ， 好 的 代码 就 像 文 学 作品 ， 
不 仅 达 意 ， 更 要 优美 。 那 什么 是 “好 ”? 什么 是 “优美 ”? 领悟 编程 代码 优美 的 过 
程 类 似 参 禅 ， 除 了 不 断 练习 ， 也 需要 理解 一 些 原则 。 

Python 编译 器 以 函数 库 的 形式 内 置 了 一 个 有 趣 的 文件 ， 被 称 为 “Python 之 禅 ” 
(The Zen of Python)。 当 调用 如 下 一 行 语句 后 ， 会 出 现 一 段 有 趣 的 运行 结果 。 


>>>import this 


| zhe Zen of Python, by Tim Peters 


Beautiful is better than ugly. 
Explicit is better than implicit. 
Simple is better than complex. 
Complex is better than complicated. 
Flat is better than nested. 


Sparse is better than dense. 

Readability counts. 

Special cases aren't special enough to break the rules. 

Although practicality beats purity. 

Errors should never pass silently. 

Unless explicitly silenced. 

In the face of ambiguity, refuse the temptation to guess. 

There should be one-- and preferably only one --obvious way to do it. 
Although that way may not be obvious at first unless you're Dutch. 
Now is better than never. 

Although never is often better than *right* now. 

If the implementation is hard to explain, it's a bad idea. 


If the implementation is easy to explain, it may be a good idea， 
Namespaces are one honking great idea -- let's do more of those! 


这 是 一 篇 由 Tim Peters 撰写 的 文章 , 介绍 了 编写 优美 的 Python 程序 所 需要 关注 
的 一 些 重要 原则 。 这 里 给 出 了 作者 对 Python 之 禅 的 一 个 参考 翻译 及 一 些 编程 体会 ， 
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供 读 者 参考 。 
Python 之 禅 ”作者 : Tim Peters 译 者 心得 
。 优美 胜 于 丑陋 以 编写 优美 代码 为 目标 ， 不 多 解释 
。 明了 胜 于 隐 星 优美 代码 应 该 清晰 明了 ， 规 范 统一 
。 简洁 胜 于 复杂 优美 代码 应 该 逻辑 简洁 ， 避 免 复杂 膛 辑 
。 复杂 胜 于 凌乱 如 果 必 须 采 用 复杂 人 逻辑 ， 接 口 关 系 也 要 清晰 
。 扁平 胜 于 髓 套 优美 代码 应 该 是 扁平 的 ， 避 免 太 多 层次 峰 套 
。 间隔 胜 于 紧凑 优美 代码 间隔 要 适当 , 每 行 代码 解决 适度 问题 
。 可 读 性 很 重要 优美 代码 必须 是 可 读 且 易 读 的 
。 即便 假借 特例 的 实用 性 之 名 ， 也 不 要 违背 | 上 述 规则 是 至 高 无 上 的 
上 述 规则 


。 除非 你 确定 需要 ， 任 何 错误 都 应 该 有 应 对 | 捕获 异常 ， 不 让 程序 留 有 因 错 误 退 出 的 可 能 
。 当 存 在 多 种 可 能 ， 不 要 尝试 去 猜测 
。 只 要 你 不 是 Guido, 对 于 问题 尽量 找 一 种 ，| 不 要 试图 给 出 多 种 方案 ， 找 到 一 种 实现 它 ， 几 


最 好 是 唯一 明显 的 解决 方案 平 所 有 人 都 没有 Guido 那么 牛 
。 做 也 许 好 过 不 做 ， 但 不 假 思 索 就 动手 还 不 | 编程 之 前 要 有 思考 
如 不 做 
。 如 果 你 无 法 向 人 描述 你 的 实现 方案 ， 那 肯 | 能 说 清楚 的 往往 才 是 对 的 
定 不 是 一 个 好 方案 
。 如 果实 现 方案 容易 解释 ， 可 能 是 个 好 方案 
。 命名 空间 是 绝妙 的 理念 ， 要 多 运用 适合 复杂 程序 编程 


瑞明 代码 的 艺术 
人 好 的 葵 库 代码 不 仪 能够 完成 蕊 能 ， 也 是 一 件 艺 术 作 襄 ， 寺 于 程 订 页 来 训 ， 络 \ 
; 大 多 数 时 间 在 阅读 并 修改 代码 ， 好 的 代码 可 读 性 能 将 这 种 阅读 变 成 一 各 享受， 如 | 
; 何 能 够 编写 好 的 代码 呢 ? 请 大 家 首先 熟练 掌握 一 门 语言 ， 如 Python; 其 次 ,要 阅 ， 
; 读 一 定量 优质 的 代码 ， 思 考 这 些 代码 的 编程 思路 和 风格 ; 最 后 ， 选择 一 个 有 兴趣 
的 项 目 编写 代码 、 修 改 、 再 修改 ， 直 到 你 认为 它 是 个 作品 为 止 。 | 


e200 ae 


除了 Python 之 禅 所 表达 的 Python 设计 理念 ， 该 程序 还 有 另 一 段 魅 力 。 请 读者 
在 Python 安装 目录 中 找到 Lib/this.py 文件 ， 该 程序 内 容 如 下 : 


实例 代码 11.1 this.py 


Ss = """Gur Mra bs Clguba, ol Gvz Crgref 


Ornhgvshy vf orggre guna htyl. 


RKCYVPVg Vf orggre guna vzcyvpvg. 
FvzcCyr vf orggre guna pbzcyrk. 


Pbzcyrk vf orggre guna pbzcyvpngrgq. 


J 人 器 Np 


Syng vf orggre guna arfgrg. 
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8 Fcnefr vf orggre guna qrafr. 

9 Ernqnovyvgl pbhagf. 

10 | Fcrpvny pnfrf nera'g fcrpvny rabhtu gb oernx gur ehyrf. 

11 | Nygubhtu cenpgvpnyvgl orngf chevgl. 

12 | Reebef fubhyq arire cnff fvyragyl. 

13 | Hayrff rkcyvpvgyl fvyraprgq. 

14 | Va gur snpr bs nzovthvgl, ershfr gur grzcgngvba gb thrff. 

15 | Gurer fubhyq or bar-- nadq cersrenoyl bayl bar --boivbhf jnl gb 
16 | qb vg. 

17 | Nygubhtu gung jnl znl abg or boivbhf ng svefg hayrff lbh'er Qhgpu. 
18 | Abj vf orggre guna arire. 

19 | Nygubhtu arire vf bsgra orggre guna *evtug* abj. 

20 | Vs gur vzcyrzragngvba vf uneq gb rkcynva, vg'f n onq vgrn. 

21 | Vs gur vzcyrzragngvba vf rnfl gb rkcynva, vg znl or n tbbq vdqrn 。 
22 | Anzrfcnprf ner bar ubaxvat terng vqrn -- yrg'f qb zber bs gubfrl""" 


24 |d=1) 

25 | £0r 二 in (65, 97): 

26 for i in range(26): 

27 d[chr(i+c)] = chr((i+13) % 26 + c) 


28 | print("".join([d.get(c, ¢c) for c in s])) 


该 程序 第 1 到 第 23 行 是 一 个 字符 串 s， 但 该 字符 串 并 非 明 文 。 将 s 转换 成 明文 
内 容 的 代码 是 从 第 25 行 到 第 30 行 。 在 这 些 代码 中 ， 可 以 看 到 字典 、 列 表 和 元 组 类 
型 ， 下 面 逐 行 来 阅读 这 个 代码 的 功能 。 

第 24 行 定义 了 一 个 空 字典 d， 第 27 行 对 字典 d 填充 了 内 容 ， 这 个 填充 将 itc 
对 应 的 字符 替换 为 (i+13)%26 +c, 即将 编号 循环 增加 了 13。chr(65) 代 表 字 符 'A', chr(97) 
代表 字符 'a'"， 因 此 ， 第 24 到 第 27 行 建立 了 字母 a 到 z 和 字母 A 到 Z 的 一 个 13 位 
循环 移动 的 对 应 表 ， 如 下 所 示 : 

密 文 : A BCDEFGHIJKLMNOPOQORSTUVWXYE 

原文 NOPQRSTUVWXYZABCDEFGHIJKLM 

密 文 :bce 站 在 记 宙 BETUVVKEY 

原文 : n opqrstuvwxyzabcdefghijklm 

这 个 算法 可 以 看 作 是 3.5 节 介 绍 的 凯撒 密码 的 一 种 扩展 ， 相 比 凯 撒 密 码 ， 这 个 
算法 采用 循环 移动 13 个 位 置 , 直接 好 处 是 原文 和 密 文 之 间 的 相互 转换 可 以 使 用 同一 
个 程序 ,建议 读者 掌握 这 个 算法 , 传递 个 小 纸 条 、 发 个 小 消息 就 不 怕 被 别人 看 懂 了 。 


思考 与 练习 
6.20 请 列 出 5 条 写 出 优美 代码 的 编程 原则 。 
6.21 实例 代码 11.1 中 第 27 行 的 功能 是 什么 ? 
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本 章 主要 介绍 了 组 合 数据 类 型 中 元 组 、 数 组 、 列 表 和 字典 等 类 型 及 基本 操作 ， 
讲解 了 如 何 使 用 jieba 词 库 对 中 文 文档 进行 分 词 并 进一步 统计 文档 词 频 ， 最 后 利用 
Python 之 禅 的 例子 介绍 了 编写 好 代码 的 基本 原则 。 


程序 练习 题 


6.1 ”随机 密码 生成 。 编 写 程序 ， 在 26 个 字母 大 小 写 和 9 个 数字 组 成 的 列表 中 
随机 生成 10 个 8 位 密码 。 

6.2 ”重复 元 素 判 定 。 编写 一 个 函数 ， 接 受 列表 作为 参数 ， 如 果 一 个 元 素 在 列表 
中 出 现 了 不 止 一 次 ， 则 返回 True， 但 不 要 改变 原来 列表 的 值 。 同 时 编写 调用 这 个 函 
数 和 测试 结果 的 程序 。 

6.3 重复 元 素 判 定 续 。 利 用 集合 的 无 重复 性 改编 程序 练习 题 6.2 的 程序 ， 获 得 
一 个 更 快 更 简洁 的 版 本 。 

6.4 文本 字符 分 析 。 编 写 程序 接收 字符 串 ， 按 字符 出 现 频 率 的 降序 打印 字母 。 
分 别 尝试 录入 一 些 中 英文 文章 片段 ， 比 较 不 同 语言 之 间 字 符 频 率 的 差别 。 

6.5 生日 悖 论 分 析 。 生 日 悖 论 指 如 果 一 个 房间 里 有 23 人 或 以 上 ， 那 么 至 少 有 
两 个 人 生日 相同 的 概率 大 于 50%。 编写 程序 ， 输出 在 不 同 随机 样本 数量 下 ，23 个 人 
中 至 少 两 个 人 生日 相同 的 概率 。 

6.6 《红楼 梦 》 人 物 统计 。 编 写 程序 统计 《红楼 梦 》 中 前 20 位 出 场 最 多 的 
人 物 。 
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刻 育 融 太 易 汪 工具 起 藤 个 心 类 他 匆 筷 考 ， 笑 之 第 优 谍 加 打印 注 所 。 
The most effective debugging tool is still careful thought, coupled with judiciously 
placed print statements. 
一 一 布 赖 恩 。 克 尼 汉 (Brian W. Kernighan ) 
著名 的 计算 机 科学 家 ， 参 加 了 UNIX 系统 和 C 语言 的 开发 
计算 机 程序 设计 领域 许多 具有 影响 力 著 作 的 作者 


! 〈1) 掌握 文件 的 读 写 方法 以 及 打开 和 关闭 等 基本 操作 。 
! (2) 理解 数据 组 织 的 维度 及 其 特点 。 

! (3) 掌握 一 二 维 数据 的 存储 格式 和 读 写 方法 。 

! (4) 运用 PIL 库 进行 基本 的 图 像 处 理 。 

(5) 运用 json 库 进行 数据 的 维度 转换 。 

! (6) 了 解 高 维 数据 的 存储 格式 和 读 写 方法 。 


a 


EE 


字符 画 (ASCII Arb 的 历史 可 以 追溯 到 计算 机 诞生 之 初 ， 起 初 用 在 图 形 显示 功能 
受 限 的 设备 上 ， 用 ASCII 字符 集中 的 可 打印 字符 拼 成 图 片 。 如 今 ， 高 清 显 示 屏 早已 
普及 ， 字 符 画 更 多 被 当 作 一 门 艺 术 来 欣赏 ， 很 多 人 喜欢 用 字符 画 处 理 自己 的 照片 作 
为 独一无二 的 创意 头像 。 

想 了 解 如 何 用 不 超过 50 行 Python 代码 生成 一 幅 精 美的 字符 画 吗 ? 
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7.1 文件 的 使 用 


vv te ee a 


DS 


文件 是 一 个 存储 在 辅助 存储 器 上 的 数据 序列 , 可 以 包含 任何 数据 内 容 。 概念 上 ， 
文件 是 数据 的 集合 和 抽象 ， 类 似 地 ， 函 数 是 程序 的 集合 和 抽象 。 用 文件 形式 组 织 和 
表达 数据 更 有 效 也 更 为 灵活 。 文 件 包括 两 种 类 型 : 文本 文件 和 二 进 制 文 件 。 
文本 文件 一 般 由 单一 特定 编码 的 字符 组 成 ， 如 UTF-8 编码 ， 内 容 容 易 统一 展示 
和 阅读 。 大 部 分 文本 文件 都 可 以 通过 文本 编辑 软件 或 文字 处 理 软件 创建 、 修 改 和 阅 
读 。 由 于 文本 文件 存在 编码 ， 因 此 ， 它 也 可 以 被 看 作 是 存储 在 磁盘 上 的 长 字符 串 ， 
例如 一 个 txt 格式 的 文本 文件 。 
二 进 制 文件 直接 由 比特 0 和 比特 1 组 成 ， 没 有 统一 字符 编码 ， 文 件 内 部 数据 的 
组 织 格式 与 文件 用 途 有 关 。 二 进 制 是 信息 按照 非 字 符 但 特定 格式 形成 的 文件 , 例如 ， 
png 格式 的 图 片 文件 、avi 格式 的 视频 文件 。 二 进 制 文件 和 文本 文件 最 主要 的 区 别 在 
于 是 否 有 统一 的 字符 编码 。 二 进 制 文件 由 于 没有 统一 字符 编码 ， 只 能 当 作 字 节 流 ， 
而 不 能 看 作 是 字符 串 。 
无 论文 件 是 创建 为 文本 文件 还 是 二 进 制 文件 , 都 可 以 用 “文本 文件 方式 ”和 “二 
进 制 文件 方式 ”打开 ， 但 打开 后 的 操作 不 同 。 
【 微 实例 7.1】〗 理 解 文本 文件 和 二 进 制 文件 的 区 别 。 
首先 ， 用 文本 编辑 器 生成 一 个 包含 “中 国 是 个 伟大 的 国家 !” 的 txt 格式 文本 文 
件 ， 命名 为 7.1.txt。 分 别 用 文本 文件 方式 和 二 进 制 文件 方式 读 入 ， 并 打印 输出 效果 ， 
代码 如 下 : 


微 实例 7.1 m7.1DiffTextBin.py 


textFile = open("7.1.txt","rt") #t 表示 文本 文件 方式 
print (textFile.readline()) 

textFile.close() 

binFile = open("7-1.txt","rb")  #r 表示 二 进 制 文件 方式 
print (binFile.readline()) 

binFile.close!() 


WN PP 


>>> 


中 国 是 个 伟大 的 国家 ! 
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可 以 看 到 ， 采 用 文本 方式 读 入 文件 ， 文 件 经 过 编码 形成 字符 串 ， 打 印 出 有 含义 
的 字符 ; 采用 二 进 制 方式 打开 文件 ， 文 件 被 解析 为 字 节 (Byte) 流 。 由 于 存在 编码 ， 
字符 串 中 的 一 个 字符 由 两 个 字 节 表示 。 


7.1.2 文件 的 打开 关闭 


Python 对 文本 文件 和 二 进 制 文件 采用 统一 的 操作 步骤 , 即 “ 打开 一 操作 一 关闭 ”， 
如 图 7.1 所 示 。 操 作 系统 中 的 文件 默认 处 于 存储 状态 ， 首 先 需要 将 其 打开 ， 使 得 当 
前 程序 有 权 操 作 这 个 文件 ， 打 开 不 存在 的 文件 可 以 创建 文件 。 打 开 后 的 文件 处 于 占 
用 状态 ， 此 时 ， 另 一 个 进程 不 能 操作 这 个 文件 。 可 以 通过 一 组 方法 读 取 文件 的 内 容 
或 向 文件 写 入 内 容 ， 此 时 ， 文 件 作 为 一 个 数据 对 象 存在 ， 采 用 <a>.<b>0 方 式 进行 操 
作 。 操 作 之 后 需要 将 文件 关闭 ， 关 闭 将 释放 对 文件 的 控制 使 文件 恢复 存储 状态 ， 此 
时 ， 另 一 个 进程 将 能 够 操作 这 个 文件 。 
a.write(s) 
a.writelines'(lines) 
a.seek(offset) 


人 areadall() | 钢 
文件 操作 a.read{size) 


a.readline (size) 


a=open(...) 


一 ~ 一、a.readlines (hint) 


ea 


一 


a.close() ss 
图 7.1 文件 的 状态 和 操作 过 程 

Python 通过 解释 器 内 置 的 open() 函 数 打 开 一 个 文件 ， 并 实现 该 文件 与 一 个 程序 
变量 的 关联 ，open0 函 数 格 式 如 下 : 

< 变量 名 > = open (< 文件 名 >，< 打 开 模 式 >) 

open() 函 数 有 两 个 参数 : 文件 名 和 打开 模式 。 文 件 名 可 以 是 文件 的 实际 名 字 ， 
也 可 以 是 包含 完整 路 径 的 名 字 。 打 开 模 式 用 于 控制 使 用 何 种 方式 打开 文件 ，open() 
函数 提供 7 种 基本 的 打开 模式 ， 如 表 7.1 所 示 。 


表 7.1 文件 的 打开 模式 〈 共 7 个 ) 


i 


文件 的 打开 模式 了 疝 1 FA 
‘'r' 只 读 模 式 ， 如 果 文 件 不 存在 ， 返 回 异常 FileNotFoundError， 默 认 值 
'w!' 履 盖 写 模式 ， 文 件 不 存在 则 创建 ， 存 在 则 完全 有 覆盖 
‘x' 创建 写 模式 ， 文 件 不 存在 则 创建 ， 存 在 则 返回 异常 FileExistsError 
'a! 追加 写 模式 ， 文 件 不 存在 则 创建 ， 存 在 则 在 文件 最 后 追加 内 容 
'b' 二 进 制 文件 模式 
Vy 文本 文件 模式 ， 默 认 值 


Em 与 rT/w/x/a 一 同 使 用 ， 在 原 功能 基础 上 增加 同时 读 写 功 能 
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打开 模式 使 用 字符 串 方式 表示 ， 根 据 字符 串 定义 ， 单 引号 或 者 双 引 号 均 可 。 上 
述 打 开 模 式 中 ，YT、'w'、X'、b' 可 以 和 'b'、**、 中 组 合 使 用 ， 形 成 既 表 达 读 写 又 表达 
文件 模式 的 方式 。 例 如 ，open0 函 数 默 认 采 用 'rt (文本 只 读 ) 模式 ， 读 入 程序 所 在 
目录 中 7.1.txt 文件 : 

textfile = open('7.1.txt’', 'r') 

或 

textfile = open('7.1.txt'") 

读 取 一 个 二 进 制 文件 ， 如 一 张 图 片 、 一 段 视频 或 者 一 段 音乐 ， 需 要 使 用 文件 打 
开 模 式 'rb'。 例 如 ， 打 开 一 个 名 为 “music.mp3” 的 音频 文件 : 


binfile = open('music.mp3', "Tb') 
文件 使 用 结束 后 要 用 close() 方 法 关闭 ， 释 放 文 件 的 使 用 授权 ， 该 方法 的 使 用 方 
式 如 下 : 


< 变量 名 > .close () 


7.1.3 文件 的 读 写 


当 文 件 被 打开 后 ， 根 据 打开 方式 不 同 可 以 对 文件 进行 相应 的 读 写 操作 。 注 意 ， 
当 文 件 以 文本 文件 方式 打开 时 ， 读 写 按照 字符 串 方式 ， 采 用 当前 计算 机 使 用 的 编码 
或 指定 编码 ; 当 文 件 以 二 进 制 文件 方式 打开 时 ， 读 写 按照 字 节 流 方式 。 Python 提 
供 4 个 常用 的 文件 内 容 读 取 方 法 ， 如 表 7.2 所 示 。 
表 7.2 文件 内 容 读 取 方 法 ( 共 4 个 ) 


操作 方法 海王 
<file>.readall0) 读 入 整个 文件 内 容 ， 返 回 一 个 字符 串 或 字 节 流 * 
从 文件 中 读 入 整个 文件 内 容 , 如 果 给 出 参数 ， 读 入 前 size 长 度 的 字 
<file>.read(size=-1) 符 串 或 字 节 流 
fli 从 文件 中 读 入 一 行内 容 , 如 果 给 出 参数 , 读 入 该 行 前 size 长 度 的 字 
符 串 或 字 节 流 


从 文件 中 读 入 所 有 行 , 以 每 行为 元 素 形成 一 个 列表 , 如 果 给 出 参数 ， 


<file>,readlines(hint=-1) 读 入 hint 行 


*: 字符 串 或 字 节 流 取决 于 文件 打开 模式 ， 如 果 是 文本 方式 打开 ， 返 回 字 符 串 ;否则 返回 字 节 流 。 下 同 。 


【 微 实例 7.2】 文 本 文件 逐 行 打印 。 
用 户 输入 文件 路 径 ， 以 文本 文件 方式 读 入 文件 内 容 并 逐 行 打印 ， 代 码 如 下 : 


微 实例 7.2 m7.2PrintFilebyLines.py 


1 | fname = input ("请 输入 要 打开 的 文件 : ") 
2 fo = open (fname, "r") 


3 for Line in fo.readlines() : 
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4 print(line) 
5 fo.close() 


程序 首先 提示 用 户 输入 一 个 文件 名 ， 然 后 打开 文件 并 赋值 给 文件 对 象 变量 fo。 
文件 的 全 部 内 容 通过 fo.readlines0) 方 法 读 入 到 一 个 列表 中 ， 列 表 的 每 个 元 素 是 文件 
一 行 的 内 容 ， 然 后 通过 for-in 方式 遍历 列表 ， 处 理 每 行内 容 。 

上 述 代码 尽管 完成 了 微 实例 7.2 的 要 求 ， 但 存在 一 些 缺 点 ， 当 读 入 文件 非常 大 
时 ， 一 次 性 将 内 容 读 取 到 列表 中 会 占用 很 多 内 存 ， 影 响 程序 执行 速度 。 一 个 合理 的 
方法 是 逐 行 读 入 内 容 到 内 存 , 并 逐 行 处 理 。 这 可 以 通过 一 个 简单 的 方法 解决 。 Python 
将 文件 本 身 作为 一 个 行 序列 ， 遍 历 文件 的 所 有 行 可 以 直接 这 样 完成 : 


fname = input ("请 输入 要 打开 的 文件 : ") 
fo = openl(fname, "r") 
for line in fo: 

Print (line) 


nD tw 2 


fo.close!() 


如 果 程 序 需要 逐 行 处 理 文件 内 容 ， 建 议 采 用 上 述 代 码 中 第 2 一 5 行 组 成 的 格式 ， 
如 下 : 
fo = open (fnamey "r") 
for line in fo: 
# 处 理 一 行 数据 
fo.close'!) 


颖 于 于 文件 的 换行 符 


; 为 "n"， 如 果 采 用 文本 方式 打开 文件 ， 换 行 符 表示 一 行 的 结束 ， 辅 助 程序 对 文件 ， 
' 的 处 理 。 文 件 的 换行 符 是 真实 存在 的 一 个 字符 。 


Python 提供 3 个 与 文件 内 容 写 入 有 关 的 方法 ， 如 表 7.3 所 示 。 


表 7.3 文件 内 容 写 入 方法 ( 共 3 个 ) 
2 
向 文件 写 入 一 个 字符 串 或 字 节 流 
将 一 个 元 素 全 为 字符 串 的 列表 写 入 文件 

改变 当前 文件 操作 指针 的 位 置 ，offset 的 值 : 

0 一 文件 开头 ; 1 一 一 当前 位 置 ，2 一 一 文件 结局 


Ez 
<file>.write(s) 


<file>.writelines(lines) 


<file>.seek(offset) 


【 微 实例 7.3】 向 文件 写 入 一 个 列表 。 
向 文 件 写 一 个 列表 类 型 ， 并 打印 输出 结果 ， 代 码 如 下 : 
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微 实例 7.3 m7.3WriteListtoFile.py 


fname = input ("请 输入 要 写 入 的 文件 : ") 
fo = open (fname, "w+") 
1s = [" 唐 诗 "， "宋词 "，" 元 曲 "] 
fo.writelines (1s) 
for line in fo: 

Print (line) 
fo.close!{) 


J 二 O 人 VoD 


程序 执行 结果 如 下 : 


可 以 看 到 , 程序 并 没有 输出 写 入 的 列表 内 容 。 在 Write Listto File.py 程序 的 目录 
中 找到 test.txt 文件 ， 打 开 可 以 看 到 其 中 的 内 容 如 下 : 


唐诗 宋词 元 曲 
列表 1s 内容 被 写 入 文件 ,但 为 何 第 5 至 第 7 行 代码 没有 将 这 些 内 容 打 印 出 来 呢 ? 
这 是 因为 文件 写 入 内 容 后 ， 当 前 文件 操作 指针 在 写 入 内 容 的 后 面 ， 第 5 至 第 7 行 代 
码 从 指针 开始 向 后 读 入 并 打印 内 容 ， 被 写 入 的 内 容 却 在 指针 前 面 ， 因 此 未 能 被 打印 
出 来 。 为 此 , 可 以 在 写 入 文件 后 增加 一 条 代码 fo.seek(0) 将 文件 操作 指针 返回 到 文件 
开始 ， 即 可 显示 写 入 的 内 容 ， 代 码 如 下 : 


1 | fname = input ("请 输入 要 写 入 的 文件 : ") 
2 | fo = openl(fname, "w+") 

3 | ls = [" 唐 诗 " ，" 宋 词 "，" 元 曲 "] 

4 | fo.writelines (1s) 

5 | fo.seek(0) 

6 | for line in fo: 

7 Pzint(1LIine) 

8 


fo.close() 


程序 执行 结果 如 下 : 


可 能 会 有 读者 认为 fo.writelines(ls) 写 入 后 的 内 容 与 预期 不 符 ， 因 为 writelines() 
正如 其 名 ， 该 函数 似乎 应 该 把 每 个 元 素 写 入 文件 的 单独 一 行 ， 即 每 个 列表 元 素 写 入 
内 容 后 应 该 有 换行 , 但 实际 上 却 没有 。fo.writelines0 方 法 并 不 在 列表 后 面 增加 换行 ， 
只 是 将 列表 内 容 直 接 排列 输出 。 
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思考 与 练习 

7.1 读 写 文件 需要 采用 open0 函 数 打开 文件 ， 采 用 绝对 路 径 打 开 操作 系统 中 的 
= 个 文件 s 

7.2 车 文件 不 存在 ， 采 用 读 取 方 式 时 ， 会 发 生 什 么 情况 ? 采用 写 入 方式 时 ， 又 
会 发 生 什么 情况 ? 

7.3 ”如何 从 文件 中 读 取 30 个 字符 ? 

7.4 下列 不 是 Python 对 文件 的 读 操 作 方 法 的 是 (  ) 

A. read B. readline C. readall D. readtext 

7.5 采用 open0 函 数 打 开 Windows 系统 目录 (C:\Windows 或 其 他 系统 安装 目 

录 ) 中 的 一 个 文件 ， 会 出 现 什 么 情况 ? 


7.2 ”模块 5: PIL 库 的 使 用 


Vo = 


7.2.1 PIL 库 概述 


PIL (Python Image Library) 库 是 Python 语言 的 第 三 方 库 ,需要 通过 pip 工具 安 
装 ，Python 安装 第 三 方 库 的 详细 方法 请 见 8.6 节 。 安 装 PIL 库 的 方法 如 下 ， 需 要 注 
意 ， 安 装 库 的 名 字 是 pillow。 


:\>pip install pillow ， # 或 者 Pip3 install pillow 


PIL 库 支 持 图 像 存 储 、 显 示 和 处 理 ， 它 能 够 处 理 几 乎 所 有 图 片 格式 ， 可 以 完成 
对 图 像 的 缩放 、 剪 裁 、 县 加 以 及 向 图 像 添 加 线条 、 图 像 和 文字 等 操作 。 

PIL 库 主要 可 以 实现 图 像 归档 和 图 像 处 理 两 方面 功能 需求 。 

(1) 图 像 归 档 : 对 图 像 进行 批 处 理 、 生 成 图 像 预览 、 图 像 格 式 转 换 等 

(2) 图 像 处 理 : 图 像 基 本 处 理 、 像 素 处 理 、 颜 色 处 理 等 。 

根据 功能 不 同 ，PIL 库 共 包括 21 个 与 图 片 相 关 的 类 ， 这 些 类 可 以 被 看 作 是 子 库 
或 PIL 库 中 的 模块 ， 子 库 列 表 如 下 。 


Image、ImageChops、ImageColor、ImageCrackCode、ImageDraw、 


JImageEnhance、ImageFile、ImageFileIO、ImageFilter、ImageFont、 
ImageGL、 ImageGrab、 Imagemath、 ImageOps、ImagePalette、ImagePath、 
ImageQt、ImageSequence、ImageStat、ImageTk、ImageWin 


口 此 站 


程序 练习 7 一 ii | 
TT Python 


图 片 资料 7=1 


Python 快速 
之 PIL 库 
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本 书 重点 介绍 PIL 库 最 常用 的 4 个 子 库 : Image、ImageFilter、ImageEnhance。 
更 多 PIL 库 内 容 请 参考 网 站 : http://effbot.org/imagingbook/。 


7.22 PIL 库 Image 类 解析 


Image 是 PIL 最 重要 的 类 ， 它 代表 一 张 图 片 ， 引 入 这 个 类 的 方法 如 下 : 


| >>>from PIL import Image - 


在 PIL 中 ， 任 何 一 个 图 像 文件 都 可 以 用 Image 对 象 表示 。 表 7.4 给 出 了 Image 
类 的 图 像 读 取 和 创建 方法 。 


表 7.4 Image 类 的 图 像 读 取 和 创建 方法 〈 共 5 个 ) 


者 "法 描 述 
Image.open(filename) 根据 参数 加 载 图 像 文 件 
Image.new(mode, size, color) 根据 给 定 参 数 创建 一 个 新 的 图 像 
Image.open(StringIO.StringIO(buffer)) 从 字符 串 中 获取 图 像 
Image.frombytes(mode, size, data) 根据 像素 点 data 创建 图 像 
Image.verify() 对 图 像 文 件 完整 性 进行 检查 ， 返 回 异常 


通过 Image 打开 图 像 文件 时 ， 图 像 的 栅 格 数据 不 会 被 直接 解码 或 者 加 载 ， 程 序 
只 是 读 取 了 图 像 文 件 头 部 的 元 数据 信息 ， 这 部 分 信息 标识 了 图 像 的 格式 、 颜 色 、 大 
小 等 。 因此 ， 打 开 一 个 文件 会 十 分 迅速 ， 与 图 像 的 存储 和 压缩 方式 无 关 。 
要 加 载 一 个 图 像 文件 ， 最 简单 的 形式 如 下 ， 之 后 所 有 操作 对 im 起 作用 。 


其 中 ，birdnest.jpg 是 一 张 鸟巢 的 夜景 图 像 ， 存 储 在 D:\pycodes 目录 中 ， 如 图 7.2 所 
示 。 在 使 用 IDLE 交 互 方式 处 理 图 片 文件 时 ,建议 采用 文件 的 全 路 径 ;如 果 使 用 Python 
文件 形式 ， 建 议 采 用 相对 路 径 ， 将 文件 和 程序 放 到 一 个 目录 中 ， 例 如 : 


1 | from PIL import Image 
2 im = Image -OPen ( "Dirdnest. jpg" ) 


Image 类 有 4 个 处 理 图 片 的 常用 属性 ， 如 表 7.5 所 示 。 


表 7.5 Image 类 的 常用 属性 ( 共 4 个 ) 


属 性 描 述 
Image.format 标识 图 像 格 式 或 来 源 ， 如 果 图 像 不 是 从 文件 读 取 ， 值 为 None 
Image.mode 图 像 的 色彩 模式 ，"L" 为 灰 度 图 像 、"RGB" 为 真 彩色 图 像 、"CMYK" 为 
出 版 图 像 
Image.size 图 像 宽度 和 高 度 ， 单 位 是 像素 (px) ， 返 回 值 是 二 元 元 组 (tuple) 


Image.palette 调 色 板 属性 ， 返 回 一 个 ImagePalette 类 型 
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查看 已 经 读 取 的 图 像 文 件 的 属性 如 下 : 


>>>print (im. format, im. size, im.mode) 
JPEG (900, 598) RGB 


丘 展 :| CMYK 9 


' 
1 
人 
I 
' 


居多 灯 的 三 原色 和 和 并 所 四 消沉 全 天 ， | 
! 颜色 不 同 ， 印 刷 中 颜色 使 用 油料 登 加 ， 混 色 原理 不 同 。 其 中 ，C 是 青色 、M 是 品 ; 
' 红色 、 YY 是 黄色 、 区 是 定位 套 板 色 (黑色 )。 ) 

Image 还 能 读 取 序 列 类 图 像 文件 , 包括 GIF、FLI、 FLC、 TIFF 等 格式 文件 ,open() 
方法 打开 一 个 图 像 时 自动 加 载 序列 中 的 第 一 帧 ， 使 用 seek0 和 tell0 方 法 可 以 在 不 同 
帧 之 间 移 动 ， 如 表 7.6 所 示 。 


表 7.6 Image 类 的 序列 图 像 操作 方法 ‘ 共 2 个 ) 


Image.seek(frame) 跳 转 并 返回 图 像 中 的 指定 帧 


Image.tell() 返回 当前 帧 的 序号 


【 微 实例 7.4】GIF 文件 图 像 提 取 。 
对 一 个 GIF 格式 动态 文件 ， 提 取 其 中 各 帧 图 像 ， 并 保存 为 文件 。 


微 实 例 7.4 m7.4 GifExtractor.py 


from PIL import Image 
im = Image.open('pybit.gif') # 读 入 一 个 GIF 文件 
try: 
im.save('picframe{:02d} .png' .format (im.tell ())) 
while True: 
im. seek (im.tell ()+1) 
im.save('picframe{:02d} .png' .format (im.tell())) 
except: 


Print ("处 理 结束 ") 


‘OO AO MDP 


微 实例 7.4 展示 了 一 种 采用 try-except 编写 程序 的 方法 ,通过 seek() 方 法 和 save() 
方法 配合 提取 GIF 图 像 格式 的 每 一 帧 ， 并 保存 为 文件 。 
Image 类 的 图 像 转换 和 保存 方法 如 表 7.7 所 示 。 


表 7.7 Image 类 的 图 像 转换 和 保存 方法 ( 共 3 个 ) 


2 描 述 
Image.save(filename, format) 将 图 像 保存 为 filename 文件 名 ，format 是 图 片 格式 
Image.convert(mode) 使 用 不 同 的 参数 ， 转 换 图 像 为 新 的 模式 


Image.thumbnail(size) 创建 图 像 的 缩 略 图 ，size 是 缩 略图 尺寸 的 二 元 元 组 
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其 中 ，save() 方 法 有 两 个 参数 ; 文件 名 filename 和 图 像 格 式 format。 如 果 调 用 时 
不 指定 保存 格式 ， 如 微 实 例 7.4，PIL 将 自动 根据 文件 名 filename 后 级 存储 图 像 ; 如 
果 指 定格 式 ， 则 按照 格式 存储 。 搭 配 采用 open0 和 save() 方 法 可 以 实现 图 像 的 格式 
转换 ， 例 如 ， 将 png 格式 转换 为 jpg 格式， 代码 如 下 。 需 要 注意 ，Image 类 的 save() 
方法 主要 用 于 保存 文件 到 硬盘 ，PIL 库 还 提供 了 功能 更 强大 的 格式 转换 方法 。 


1 | im = Image.open("birdnest.jpg") 
2 | im.save ("birdnest.Png") 


生成 “birdnest.jpg” 图 像 的 缩 略 图 ， 代 码 如 下 ( 续 上 一 个 IDLE 指令 )， 乌 策 图 
片 及 其 缩 略 图 如 图 7.2 所 示 ， 其 中 (128,128) 是 缩 略图 的 尺寸 。 


>>>im. thumbnail((128, 128)) 
>>>im.save ("birdnestTN","JPEG") 


(b) 缩 略图 


图 7.2 北京 鸟 集 图 片 及 其 缩 略 图 
Image 类 可 以 缩放 和 旋转 图 像 ， 方 法 如 表 7.8 所 示 ， 其 中 ，rotate() 方 法 以 道 时 针 
旋转 的 角度 值 作为 参数 来 旋转 图 像 。 


表 7.8 Image 类 的 图 像 旋 转 和 缩放 方法 〈 共 2 个 ) 
法 


济 


生成 副本 
生成 副本 


按 size 大 小 调整 图 像 ， 
按 angle 角度 旋转 图 像 ， 


Image.resize(size) 


Image.rotate(angle) 


Image 类 能 够 对 每 个 像素 点 或 者 一 幅 RGB 图 像 的 每 个 通道 单独 进行 操作 , 如 表 
7.9 所 示 。split(0 方 法 能 够 将 RGB 图 像 各 颜色 通道 提取 出 来 ，merge() 方 法 能 够 将 各 
独立 通道 再 合成 一 幅 新 的 图 像 。 
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表 7.9 Image 类 的 图 像 像素 和 通道 处 理 方法 〈 共 4 个 ) 
思 中 类 


Image.point(func) 


根据 函数 func 的 功能 对 每 个 元 素 进行 运算 ， 返 回 图 像 副 本 
提取 RGB 图 像 的 每 个 颜色 通道 ， 返 回 图 像 副 本 

合并 通道 ， 其 中 mode 表示 色彩 ，bands 表示 新 的 色彩 通道 
将 两 幅 图 片 iml 和 im2 按照 如 下 公式 插值 后 生成 新 的 图 像 ; 
iml*(1.0-alpha) + im2 * alpha 


Image.split() 


Image.merge(mode,bands) 


Image.blend(iml,im2,alpha) 


【 微 实 例 7.5】 图像 的 颜色 交换 。 
交换 图 像 中 的 颜色 。 可 以 通过 分 离 RGB 图 片 的 3 个 颜色 通道 实现 颜色 交换 。 
代码 如 下 ， 程 序 执行 效果 如 图 7.3 所 示 ， 夜 色 下 的 北京 鸟巢 变 成 了 蓝 色 ! 


微 实例 7.5 m7.SChangeRGB.py 


from PIL import Image 国 : ls 
im = Image.open('birdnest.jpg') 

r, g, b = im.split!() 

om = Image.merge("RGB", (b, g, r)) 


[Se 


om.save ('birdnestBGR .jpg') 


图 7.3 被 改变 颜色 的 北京 鸟巢 图 片 


操作 图 像 的 每 个 像素 点 需要 通过 函数 实现 ， 可 以 采用 lambda 函数 和 point0 方 
法 ， 例 子 如 下 ， 显 示 效 果 如 图 7.4 所 示 。 


>>>im = Image.open('D:\\pycodes\birdnest.jpg') 圭 J 开 乌 站 文件 

>>>r, g, b = im.split( # 获 得 RGB 通道 数据 

>>>newg 二 g.point(lambda i: i* 0.9) # 将 G 通道 颜色 值 变 为 原来 的 0.9 倍 
>>>newb = b.point(lambda i; i< 100) # 选择 B 通道 值 低 于 100 的 像素 点 
>>>om = Image.merge(im.mode, (r, newg, newb)) # 将 3 个 通道 合成 为 新 图 像 
>>>om.save('D:\\pycodes\\birdnestMerge.jpg") # 输 出 图 片 
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7.2.3 图像 的 过 滤 和 增强 


PIL 库 的 ImageFilter 类 和 ImageEnhance 类 提供 了 过 滤 图 像 和 增强 图 像 的 方法 。 
ImageFilter 类 共 提 供 10 种 预定 义 图 像 过 滤 方 法 ， 如 表 7.10 所 示 。 


表 7.10 ImageFilter 类 的 预定 义 过 滤 方 法 ‘ 共 10 个) 


方法 表示 描 述 
ImageFilter.BLUR 图 像 的 模糊 效果 
ImageFilter.CONTOUR 图 像 的 轮廓 效果 
ImageFilter.DETAIL 图 像 的 细节 效果 


ImageFilter.EDGE_ ENHANCE 
ImageFilter. EDGE ENHANCE MORE 


图 像 的 边界 加 强 效果 
图 像 的 阔 值 边界 加 强 效果 


ImageFilter.EMBOSS _| 图 像 的 浮雕 效果 
ImageFilter.FIND EDGES 图 像 的 边界 效果 
ImageFilter.SMOOTH 图 像 的 平滑 效果 
ImageFilter. SMOOTH MORE 图 像 的 阔 值 平滑 效果 
ImageFilter.SHARPEN 图 像 的 锐 化 效果 


利用 Image 类 的 filter(0) 方 法 可 以 使 用 ImageFilter 类 ， 使 用 方式 如 下 : 

Image.filter (ImageFilter.fuction) 

【 微 实例 7.6】 图 像 的 轮廓 获取 。 

获取 图 像 的 轮廓 ， 代 码 如 下 ， 程 序 执行 效果 如 图 7.5 所 示 ， 北 京 鸟巢 变 得 更 加 
抽象 、 更 具 想象 空 间 ! 


微 实 例 7.6 m7.6GetImageContour.py 


from PIL import Image 

from PIL import ImageFilter 

im = Image.open('birdnest.jpg') 

om = im.filter (ImageFilter .CONTOUR) 
om.save('birdnestContour .jpg') 


nn WN 
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锐 化 等 ， 如 表 7.11 所 示 。 


表 7.11 ImageEnhance 类 的 图 像 增 强 和 滤 镜 方法 ( 共 5 个 ) 


方 法 
ImageEnhance.enhance(factor) 对 选择 属性 的 数值 增强 factor 倍 
ImageEnhance.Color(im) 调整 图 像 的 颜色 平衡 
ImageEnhance.Contrast(im) 调整 图 像 的 对 比 度 
ImageEnhance.Brightness(im) 调整 图 像 的 亮度 
ImageEnhance.Sharpness(im) 调整 图 像 的 锐 度 


【 微 实例 7.7】 图 像 的 对 比 度 增强 。 fi 
增强 图 像 的 对 比 度 为 初始 的 20 倍 。 代 码 如 下 ， 程 序 执行 效果 如 图 7.6 所 示 。 图 像 的 对 日 


微 实例 7.7 m7.7EnImageContrast.py 


from PIL import Image 


from PIL import ImageEnhance 


im = Image.open('birdnest.jpg') 口 | 
om = ImageEnhance.Contrast (im) 2 


ND 


om.enhance (20) .save('birdnestEnContrast.jpg') 


图 7.6 北京 鸟巢 图 片 的 20 倍 对 比 度 增强 效果 
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思考 与 练习 
7.6 ”请 描述 PIL 库 的 Image 类 、ImageFilter 类 和 ImageEnhance 类 的 基本 功能 
7.7 如 何 通过 PIL 库 打开 并 存储 一 个 图 像 ? 
7.8 采用 PIL 库 将 图 像 中 红色 系 去 掉 有 哪些 步骤 ? 


0 


位 图 图 片 是 由 不 同 颜 色 像 素 点 组 成 的 规则 分 布 ， 如 果 采 用 字符 串 代替 像素 ， 图 
像 就 成 为 了 字符 画 。 

首先 自 定 义 一 个 字符 集 ， 将 这 个 字符 集 奉 代 图 像 中 的 像素 点 ”使 得 每 个 字符 对 
应 图 像 中 的 不 同 颜色 。 字 符 的 种 类 越 多 则 越 能 还 原 图 像 中 的 色彩 变化 ， 图 片 也 更 加 
富有 层次 感 。 


1 | ascii char =1ist("$6B$8&NM#*oahkbdPpqwm2ZO0QLCUUYXzcvunxr]jEN\ 
2 1234568795t/N| ()1{}1]?- +~<2E075vNA .n) 


图 像 的 色彩 信息 无 法 被 黑白 ASCII 字符 直接 模拟 ， 可 以 使 用 灰 度 值 将 彩色 图 像 
转换 为 高 质量 的 黑白 文稿 。 灰 度 值 指 黑白 图 像 中 的 颜色 深度 , 白色 为 255, 黑色 为 0。 
这 里 定义 ， 灰 度 值 从 大 到 小 依次 使 用 字符 集中 从 左 到 右 的 符号 ， 因 此 ， 可 以 直接 求 
出 不 同 灰 度 值 在 字符 集中 对 应 的 字符 编号 。 

定义 彩色 向 灰 度 的 转换 公式 如 下 , 其 中 R、G、B 分 别 是 像素 点 的 RGB 颜色 值 : 


Gray' = R* 0.2126 + G * 0.7152 + B *# 0.0722 


因此 ， 像 素 的 RGB 颜色 值 与 字符 集 的 对 应 函数 如 下 : 


def get charl(r, b, g, alpha=256): 
if alpha == 0: 
return : ' 
gray = int(0.2126 * r+ 0.7152 * g+ 0.0722 * b) 
unit = 256 / lenl(ascii char) 


return ascii char[gray//unit] 


OW 


为 了 使 生成 的 字符 画 有 最 佳 效 果 ， 可 以 利用 PIL 库 中 Image 类 的 resize(size) 函 
数 对 图 片 重新 设 定 大 小 .size 是 一 个 二 元 元 组 ,分 别 表示 新 图 像 的 长 度 和 宽度 。resize() 
函数 不 是 简单 地 改变 图 像 大 小 ， 而 是 对 像素 在 新 尺寸 下 重新 排列 。 

创建 一 个 空 字符 串 txt， 然 后 利用 一 个 嵌 套 循环 向 里 面 添 加 字符 。im.getpixel() 
方法 可 以 返回 给 定 图 像 位 置 的 像素 值 ， 如 果 图 像 为 多 通道 ， 则 返回 一 个 RGB 颜色 


大 


第 7 章 文件 和 数据 格式 化 195 


元 组 。 
为 了 使 字符 画 更 加 漂亮 ， 这 里 有 一 个 小 技巧 。 不 同 的 字符 给 人 带 来 的 视觉 效 末 
是 不 同 的 ， of 这 类 字符 有 浓密 的 色彩 感 而 1 这 类 字符 空白 较 多 ， 一 般 适合 m7g， 


表示 浅 色 。 在 生成 字符 画 后 , 可 以 根据 字符 集 和 图 像 的 对 照 适当 修改 字符 排列 顺序 ， ”图像 的 字符 画 

例如 ， 将 背景 色 对 应 的 字符 修改 为 .或 /， 将 会 更 加 突出 图 像 效 果 ， 将 图 像 中 浓 墨 重 绘制 i 

彩 的 地 方 使 用 @* 或 B 人 表示 会 使 层 次 感 更 强 。 NR 
实例 代码 12.1 如 下 : 


实例 代码 12.1 el2.1DrawCharImagepy 
| #el12.1DrawCharImage .py 

2 | from PIL import Image 

3 ascii char = list('"$% &WM#*oahkbdpqwmZO0QLCJUYXzcvunxr\ 
| EEINT () L0H] ?TN ) 

4 def get charl(r, b, g, alpha=256): 

SS if alpha == 

6 return ' ' 

7 gray = int(0.2126 * r+i+0.7152 * g+ 0.0722 * b) 

8 unit = 256 / lenl(ascii char) 

9 return ascii chaz [int(gray//unit) ] 

10 | def main() : 

iE | im = Image.open('astro.jpg') 

| WIDTH, HEIGHT = 100, 60 

JS im = im.resize( (WIDTH, HEIGHT)) 

14 txt = "" 

5 | for i in range (HEIGHT) : 

16 for ] in range (WIDTH): 

17 txt += get char (*im.getpixel((j, i))) 

18 txt 十 = "'\n' 

19 fo = open("pic char.txt","w") 

20 | fo.write (txt) 

21 fo.close() 

22 | main() 


采用 二 十 二 星座 的 图 像 ， 命 名 为 “astro.jpg”， 如 图 7.7 所 示 。 程 序 执行 后 
生成 的 字符 画 如 图 7.8 所 示 。 
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图 7.8 十 二 星座 图 像 的 字符 画 


丘 展 : 位 图 和 和 拓 量 图 
” ”位 图 图 像 , 亦 称 为 点 阵 图 像 ， 是 最 为 常用 的 图 像 种 类 ， 它 由 像素 阵列 组 成 。 每 ， 
' 个 像素 点 颜色 不 同 ， 放 大 位 图 可 以 看 到 构成 图 像 的 基本 像素 单元 。 位 图 图 像 在 放 ， 
! 大 时 会 失真 ， 但 却 能 够 表达 色彩 丰富 的 图 像 效 果 ， 
! 矢量 图 使 用 直线 和 曲线 来 描述 图 形 ， 图形 元 素 是 一 些 点 、 线 、 矩 形 、 多 边 形 、 
! 圆 和 弧 线 等 ， 复 杂 图 形 是 通过 数学 公式 计算 获得 的 。 和 拓 量 图 形 的 优点 是 在 放大 、 
' 缩小 或 旋转 等 情况 下 不 会 失真 ， 缺 点 是 难以 表现 色彩 层次 丰富 的 逼真 图 像 效 果 。 ， 


Seoees 
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思考 与 练习 
7.9 请 调研 一 下 彩色 向 灰 度 转换 的 标准 有 哪些 。 
7.10 实例 代码 12.1 如 何 遍 历 图 像 中 每 一 个 像素 点 ? 
7.11 Image.getpixel(x,y) 返 回 值 是 什么 ?x、y 分 别 代 表 什 么 含义 ? 


7.4 一 三 维 数据 的 格式 化 和 处 理 
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7.4.1 数据 组 织 的 维度 


一 一 数据 还 有 维度 ? 怎么 没 听 说 ? 百度 都 找 不 到 。 

一 一 本 书 独家 秘籍 ， 一 般 人 不 告诉 他 。 

计算 机 是 能 够 根据 指令 操作 数据 的 设备 ， 因 此 操作 数据 是 程序 最 重要 的 任务 。 
除了 单一 数据 类 型 (数字 、 浮 点 数 等 )， 更 多 的 数据 需要 根据 不 同 维度 组 织 起 来 ， 以 
便 进 行 管理 和 程序 处 理 。 根 据 数据 的 关系 不 同 ， 数 据 组 织 可 以 分 为 一 维 数据 、 二 维 
数据 和 高 维 数据 。 

一 维 数据 由 对 等 关系 的 有 序 或 无 序数 据 构成 ， 采 用 线性 方式 组 织 ， 对 应 于 数学 
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中 的 数组 和 集合 等 概念 。 例 如 ， 国 际 经 济 合作 论坛 20 国 集团 (G20) 的 成 员 是 对 等 
关系 ， 表 示 为 一 维 数 据 ， 内 容 如 下 。 无 论 采 用 任何 方式 分 隔 和 表示 ， 一 维 数据 都 具 
有 线性 特点 。 


| 
阿根廷 、 巴 西 、 印 度 、 印 度 尼 西亚 、 墨 西 哥 、 沙 特 阿拉 伯 、 土 耳 其 、 韩 国 


二 维 数据 ， 也 称 表格 数据 ， 由 关联 关系 数据 构成 ， 采 用 表格 方式 组 织 ， 对 应 于 
数学 中 的 矩阵 ， 常 见 的 表格 都 属于 二 维 数据 。 例 如 ， 国 家 统计 局 发 布 的 大 中 城市 新 
建 住宅 价格 指数 是 二 维 数据 ， 摘 录 部 分 如 表 7.12 所 示 。 其 中 ， 表 格 说 明 部 分 (第 一 
行 ) 可 以 看 作 是 二 维 数据 的 一 个 维度 ， 也 可 以 看 作 是 数据 外 的 说 明 。 


表 7.12 2016 年 7 月 部 分 大 /中 城市 新 建 住宅 价格 指数 


环比 : 上 月 =100; 同比 : 上 年 同月 =100; 定 基 : 2015 年 =100。 

高 维 数 据 由 键 值 对 类 型 的 数据 构成 ， 采 用 对 象 方式 组 织 ， 属 于 整合 度 更 好 的 数 
据 组 织 方式 。 高 维 数据 在 网 络 系统 中 十 分 常用 ，HTML、XML、JSON 等 都 是 高 维 
数据 组 织 的 语法 结构 。 以 描述 本 书 作者 的 JSON 格式 为 例 ， 下 面 给 出 了 这 种 高 维 数 
据 的 表示 形式 ， 其 中 ，" 本 书 作者 "和 后 续 内 容 通过 冒号 〈:) 形成 一 个 键 值 对 ， 每 个 
内 容 中 "姓氏 "、" 名 字 " 和 "单位 "分 别 与 后 面 的 内 容 形 成 键 值 对 。 内 容 按照 层级 采用 去 
号 和 大 括号 组 织 起 来 。 高 维 数据 相 比 一 维和 二 维 数据 能 表达 更 加 灵活 和 复杂 的 数据 
关系 。 

"本 书 作者 ”: [ 

"姓氏 ”: " 斋 "， | 
名 字 i 
单位 ” : "北京 理工 大 学 "” }， 
奸 民 了 
"和 名字" :; " 欣 "， 
单位 ”: 
"姓氏 
名 学 
单位 


"北京 理工 大 学 "” “}， 

" 黄 "， 

5 
”: "北京 理工 大 学 "” ] 


] 


数据 包括 文件 存储 和 程序 使 用 两 个 状态 。 存 储 不 同 维度 的 数据 需要 适合 维度 特 
点 的 文件 存储 格式 ， 处 理 不 同 维度 数据 的 程序 需要 使 用 相 适 应 的 数据 类 型 或 结构 。 
因此 ， 对 于 数据 处 理 ， 需 要 考虑 存储 格式 以 及 表示 和 读 写 等 两 个 问题 。 
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7.4.2 一 二 维 数据 的 存储 格式 


一 维 数据 是 最 简单 的 数据 组 织 类 型 ， 有 多 种 存储 格式 ， 常 用 特殊 字符 分 隔 ， 分 
隔 方式 如 下 。 

(1) 用 一 个 或 多 个 空格 分 隔 ， 例 如 ; 

中 国 美国 日 本 德国 法 国 英国 意大利 

(2) 用 逗号 分 隔 ， 注 意 ， 这 里 的 逗号 是 英文 输入 法 中 的 半角 逗号， 不 是 中 文 喜 
号 ， 例 如 : 

中 国 ， 美 国 ， 日 本 ,德国 ， 法 国 ， 英 国 ， 意 大 利 

(3) 用 其 他 符号 或 符号 组 合 分 隔 ， 建 议 采 用 不 出 现在 数据 中 的 特殊 符号 , 例如 : 

中 国 ; 美国 ; 日 本 ; 德国 ; 法 国 ; 英国 ; 意大利 

二 维 数据 由 多 条 一 维 数据 构成 ， 可 以 看 成 是 一 维 数据 的 组 合 形式 。 本 书 介 绍 一 
种 国际 通用 的 一 二 维 数据 存储 格式 : CSV 格式 。 这 种 格式 十 分 简单 ， 来 源 于 使 用 去 
号 分 隔 的 一 维 数据 表示 方式 。 

逗号 分 隔 数 值 的 存储 格式 叫做 CSV 格式 “(Comma-Separated Values， 逗 号 分 隔 
值 ), 它 是 一 种 通用 的 、 相 对 简单 的 文件 格式 ， 在 商业 和 科学 上 广泛 应 用 ,尤其 应 用 
在 程序 之 间 转 移 表 格 数据 。 该 格式 的 应 用 有 如 下 一 些 基本 规则 。 

(1) 纯 文本 格式 ， 通 过 单一 编码 表示 字符 。 

(2) 以 行为 单位 ， 开 头 不 留 空 行 ， 行 之 间 没 有 空 行 。 

(3) 每 行 表示 一 个 一 维 数据 ， 多 行 表 示 二 维 数据 。 

(4) 以 逗号 (英文 ， 半 角 ) 分 隔 每 列 数 据 ， 列 数据 为 空 也 要 保留 逗号 。 

(5) 对 于 表格 数据 ， 可 以 包含 或 不 包含 列 名 ， 包 含 时 列 名 放置 在 文件 第 一 行 

例如 ， 表 7.12 中 的 二 维 数据 采用 CSV 存储 后 的 内 容 如 下 : 


城市 ,环比 ,同比 , 定 基 

兹 兹 ,工人 5120 Ty 和 十 . 
上 海 ,101.2,127.3,127 . 
广州 ,101.3,119.4,120 
深圳 , 工 02,140.9,145.5 
沈 阴 ;L001 出 0 下。 L016 


CSYV 格式 存储 的 文件 一 般 采 用 .csv 为 扩展 名 , 可 以 通过 Windows 平台 上 的 记事 
本 或 微软 Office Excel 工具 打开 ， 也 可 以 在 其 他 操作 系统 平台 上 用 文本 编辑 工具 打 
开 。 一 般 的 表格 数据 处 理工 具 〔( 如 微软 Office Excel 等 ) 都 可 以 将 数据 另存 为 或 导 
出 为 CSV 格式 ， 用 于 不 同 工 具 间 进 行 数据 交换 。 


Python 的 csy 标准 库 


Eicon 提供 了 一 个 读 写 csv 的 标准 库 ， 可 以 通过 import csv 使 用 。csV 库 包 含 ， 
' 操作 CSV 格式 最 基本 的 功能 ,csv.reader() 和 csv.writer(). 由 于 CSV 格式 十 3 简单 ， | 
! 对 于 一 般 程序 来 说 ， 建 议程 序 员 自 己 编写 操作 CSV 格式 的 函数 ， 这 样 更 灵活 和 
' 个 性 化 。 对 于 需要 运行 在 复杂 环境 或 商业 使 用 的 程序 ， 建 议 采 用 csv 标准 库 。 ] 


< 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
-2 


a 


Go 心 


第 7 章 文件 和 数据 格式 化 199 


7.4.3 一 二 维 数据 的 表示 和 读 写 


CSV 文件 的 每 一 行 是 一 维 数据 , 可 以 使 用 Python 中 的 列表 类 型 表示 , 整个 CSV 
文件 是 一 个 二 维 数据 ， 由 表示 每 一 行 的 列表 类 型 作为 元 素 ， 组 成 一 个 二 维 列表 。 例 
如 ， 表 7.12 中 的 数据 采用 列表 表示 如 下 ， 对 应 代码 见 微 实例 7.8。 


[ 
' 城 市 '，' 环 比 '"，' 同 比 '"，' 定 基 \n']， 

Ye “le UD 
"上 Nn], 
1 产 州 "?， LOL 3", "ll194", “W120 0%n']y 
1 深圳 5， 7 102 .0 "140.9', "145.5MNn'], 
' 沈 阳 '，'100.1'， "101.4' 


和 


"LOL 6N\n"], 


源 代码 7~9; 


【 微 实例 7.8】 导 入 CSV 格式 数据 到 列表 。 Es 


的 


将 表 7.12 中 的 二 维 数据 通过 微软 Office Excel 等 工具 录入 ， 另 存 成 文件 。 据 到 列表 
price2016.csv， 或 直接 使 用 本 书 附带 文件 ， 操 作 CSV 文件 的 微 实例 代码 如 下 : 


微 实 例 7.8 m7.8GetCSV2List.py 


fo open ("price2016.csv", "r") 


ls = [] 


for line in fo: 


1 
2 
3 
4 line = line.replace("\n","") 
5 ls.append (line.split(",")) 

6 Print(1s) 

7 


fo.close() 


需要 注意 的 是 ， 以 split(",") 方 法 从 CSYV 文件 中 获得 内 容 时 ， 每 行 最 后 一 个 元 素 
后 面包 含 了 一 个 换行 符 ("n")。 对 于 数据 的 表达 和 使 用 来 说 , 这 个 换行 符 是 多 余 的 ， 
可 以 通过 使 用 字符 串 的 replace() 方 法 将 其 去 掉 ， 如 第 4 行 。 

微 实 例 7.8 从 CSV 文件 中 一 次 性 读 入 全 部 数据 写 入 列表 , 之后， 在 程序 内 部 使 
用 列表 即 可 表达 数据 ， 这 种 一 次 性 读 入 方式 适合 一 部 分 应 用 。 另 有 一 部 分 应 用 并 不 
需要 将 数据 全 部 读 入 程序 再 操作 ， 可 以 逐 行 读 取 CSYV 文件 , 逐 行 运算 处 理 ， 这 种 情 
况 仅 使 用 普通 列表 即 可 。 

【 微 实例 7.9】 逐 行 处 理 CSV 格式 数据 。 

从 CSV 文件 中 读 取 数 据 ， 去 掉 内 容 中 的 逗号 ， 打 印 到 屏幕 。 使 用 price2016.csv 
文件 ， 代 码 如 下 : 
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微 实例 7.9 m7.9GetCSVbyLine.py 
1 fo = open("price2016.csv", "r") 
之 ls= [] 

3 for line in fo: 

4 line = line.replace("\n","") 
5 ls = line.split(",") 

6 Lns = "" 

7 for 5 Tn 1s: 

8 lns += "{}\t".format(s) 
9 print(lns) 

10 | fo.close() 


运行 后 的 输出 结果 如 下 : 


对 于 Python 列表 变量 保存 的 一 维 数据 结果 ， 可 以 用 字符 串 的 join() 方 法 组 成 逗 
号 分 隔 形 式 再 通过 文件 的 write0 方 法 存储 到 CSV 文件 中 ,具体 过 程 参 考 微 实 例 7.10。 
其 中 ，",".join(ls) 生 成 一 个 新 的 字符 串 ， 它 由 字符 串 "," 分 隔 列 表 ls 中 的 元 素 形 成 。 

【 微 实例 7.10】 一 维 数据 写 入 CSV 文件 。 

将 一 维 数据 [北京 , '101.5, '120.7, '121.41 写 入 price2016bj.csv 文件 ， 代 码 如 下 : 


微 实例 7.10 m7.10WriteD1toCSV.py 


fo = open("price2016bj.csv", "w") 

1s = [北京 '。 "101,5": "L2057'; "421.4"] 
fo.write(",".join(ls)+ "\n") 

fo.close() 


CO 


对 于 列表 中 存储 的 二 维 数据 ， 可 以 通过 循环 写 入 一 维 数据 的 方式 写 入 CSV 文 
件 ， 参 考 代 码 样式 如 下 : 
£6 Foew in 15: 
< 输出 文件 >.write(",".join(row)+"\n") 
【 微 实例 7.11】 三 维 数 据 写 入 CSV 文件 。 
读 入 price2016.csv 文件 ， 将 其 中 的 数据 读 出 ， 将 数字 部 分 计算 百分比 后 输出 到 
price2016out.csv 文件 。 输 出 的 CSV 文件 内 容 如 下 : 
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城市 ,环比 ,同比 , 定 基 

北京 ,1.0%,1.2%,1.2% 

上 海 ,1.0%,1.3%,1.3% 

广州 ,1.0%,1.2%,1.2% 

深圳 ,1.0%,1.4%,1.5% 

沈阳 ,1.0%,1.0%,1.0% 

整个 程序 分 为 3 个 部 分 : 首先 将 原始 文件 中 的 数据 全 部 导入 , 用 列表 方式 表示 ; 
第 二 ， 对 列表 中 的 元 素 逐 行 判 断 ， 对 浮 点 数值 进行 百分比 运算 , 运算 结果 写 回 列表 ; 
第 三 ， 将 更 新 后 的 列表 输出 新 的 CSV 文件 ， 代 码 如 下 : 


微 实例 7.11 m7.11WriteD2toCSV.py 

1 fr = open("price2016.csv", "r") 

2 fw = open("price2016out.csv", "w") 

3 ls = [] 

4 | for line in fr: # 将 CSV 文件 中 的 二 维 数据 读 入 到 列表 变量 
和 line = line.replace("\n","") 

6 ls.append (line.split(",")) 

7 | for i in range(len(1s) ) : 。 # 饥 历 列表 变量 计算 百分数 

8 for Jj in range(len(ls[i])): 

9 if ls[i][j] .replace(".","") .isnumeric(): 

10 ls[i][j] = "{:.2}%".format(float(ls[i][j])/100) 
11 | for row in ls:  # 将 列表 变量 中 的 两 位 数据 输出 到 CSV 文件 
区 print (row) 

le fw.write(",".join(row)+"\n") 

14 Er.closel() 

15 | fw.close() 


微 程序 7.11 中 第 9 行 代码 用 于 判断 一 个 字符 串 是 否 类 似 "101.5" 由 数字 或 小 数 点 
构成 。 由 于 Python 中 没有 单个 函数 能 够 直接 判断 ， 因 此 ， 通 过 replace() 方 法 将 其 中 
可 能 的 小 数 点 去 掉 ， 再 通过 isnumeric() 方 法 判断 其 余 字 符 是 否 都 是 数字 。 这 是 一 种 
不 完备 的 判断 方式 ， 但 在 该 例 的 应 用 背景 下 可 以 使 用 。 


思考 与 练习 
7.12 ”请 描述 数据 维度 的 含义 。 
7.13 JSON 是 一 种 什么 样 的 数据 格式 ? 
7.14 思考 CSV 格式 能 否 支持 高 维 数 据 表示 。 


7.5 实例 13: CSV 格式 的 HTML 展示 
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一 个 常见 的 需求 是 , 用 更 直观 的 HTML 方式 通过 浏览 器 展示 CSV 格式 数据 集 。 
学 习 这 个 实例 后 ， 读 者 将 具备 处 理 一 二 维 数据 在 存储 、 读 取 、 操 作 、 写 入 及 展示 方 
面 的 全 套 能 力 ， 操 作 基本 数据 不 再 是 问题 。 
由 于 CSYV 主要 存储 二 维 表格 数据 , 这 个 例子 生成 的 HTML 也 是 二 维 表格 样式 ， 
与 CSV 数据 直接 对 应 。 表 7.12 中 的 数据 在 运行 后 的 效果 如 图 7.9 所 示 。 
2016 年 7 月 部 分 大 中 城市 新 建 住宅 价格 指数 


北京 101.5 | 120.7 121. 4 
上 海 101.2 [ 127.3 127.8 
广州 101.3 | 119.4 | 120.0 
深圳 102.0 140.9 145.5 
沈阳 100. 1 101.4 101.6 


图 7.9 三 维 数据 的 ETML 展示 


HTML (HyperText Markup Language) 是 超 文本 标记 语言 , 它 是 专门 为 Web (网 
页 ) 显示 创建 的 语言 。 HTML 语言 本 质 上 是 键 值 对 的 标记 , 它 采 用 <key>value</key> 
的 方式 表达 键 key 对 应 的 值 value。 一 个 独立 的 HTML 文件 至 少 由 <html>HTML 内 
容 </html> 构 成 ， 其 中 ， 内 容 部 分 由 <body>body 内 容 </body> 构 成 。HTML 语言 具有 
完善 庞大 的 语法 体系 ,这 里 仅 介绍 与 表格 展示 相关 的 内 容 。 首 先 看 一 下 HTML 代码 
的 格式 ， 图 7.9 展示 二 维 数据 对 应 的 HTML 完整 代码 如 下 ， 该 文件 名 称 为 
CSV2HTML.html。 


文件 名 : CSV2HTML .html 

1 <!IDOCTYPE HTML> 

过 <html> 

Ee <body> 

4 <meta charset=utf-8> 

5 <h2 align=center>2016 年 7 月 部 分 大 中 城市 新 建 住宅 价格 指数 </h2> 
6 <table border='1' align=center width=70%> 
7 <tr bgcolor='orange'> 

8 <th width="25%"> 城 市 </th> 

9 <th width="25%"> 环 比 </th> 

10 | <th width="25%"> 同 比 </th> 

11 | <th width="25%"> 定 基 </th> 

12 | </tr> 


半生 <tr><tqd> 北 京 </td><td>101.5</td><td>120.7</td><td3121.4</td></tr> 
14 | <tr><td> 上 海 </td><td>101.2</td><tqd>127.3</td><td>127.8</td></tr> 
他 <tr><td> 广 州 </td><tqd>101.3</td><td>119.4</td><td>120.0</td></tr> 
16 | <tr><td> 深 ll</td><td>102.0</td><td>140.9</td><td>145.5</td></tr> 
17 | <tr><td> 沈 阳 </td><tqd>100.1</td><tqd>101.4</td><td>101.6</td></tr> 
18 </table> 

19 | </body> 

ly) </html> 
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HTML 语法 中 ， 由 <table> 表 格 内 容 </table> 形 成 的 是 一 个 表格 ，<tr> 表 格 的 一 行 
</tr> 表 示 表 格 的 一 行 。<te 标 签 中 <th> 表 头 列 </th> 表 示 表 格 表 头 的 一 列 ; <td> 内 容 
列表 不 浊 全 内 千 的 一 列 。 

Web 前 端 开发 


| Web 前 端 开发 指 开发 基于 HTML 的 展示 效果 , 经历 过 静 态 网 页 制作 、 动态 网 ， | 
' 页 制作 和 Web 2.0 开发 等 几 个 阶段 。Web 前 端 开发 主要 采用 HTML 5、CSS、 
! JavaScript 等 语言 ， 这 些 语言 由 W3C ( 万 维 网 联盟 ) 进行 规范 化 并 制定 标准 。 目 ， 


! 前 大 量 手机 应 用 的 界面 也 采用 Web 开发 ， 相 比 用 安 卓 系统 中 的 Java 语言 和 iOS 
' 系统 中 的 Object C 语言 ，Web 开发 的 手机 应 用 能 够 在 不 同 手机 操作 系统 上 运行 . 


将 CSV 文件 转换 成 HTML 文件 分 为 3 个 步骤 : 首先 ， 读 入 CSV 文件 ， 获 得 文 
件数 据 ， 其 次 ， 对 数据 进行 格式 处 理 和 转换 ; 最 后 ， 输 出 与 上 述 代码 相同 的 HTML 
格式 文件 。CSV2HTML.html 文件 中 除了 数据 之 外 都 是 格式 化 的 规则 字符 串 。 
程序 的 设计 思路 是 不 管 HTML 样式 如 何 ， 只 要 替换 其 中 的 数据 ， 就 能 够 显示 不 同 数 
据 对 应 的 表格 。 实 例 代 码 13.1 如 下 。 


实例 代码 13.1 el3.1csv2html.py 

1 #el13.1csv2html .py 

之 segl = "'"'" 

3 <!IDOCTYPE HTML>\n<html>\n<body>\n<meta charset=gb2312> 
4 <h2 align=center>2016 年 7 月 部 分 大 中 城市 新 建 住宅 价格 指数 </h2> 
5 <table border='1' align="center'" width=70%> 

6 | <tr bgcolor='orange'>\n !! 1 

六 seg2 = "</tr>\n" 

8 seg3 = "</table>\n</body>\n</html>" 

9 def fill data(locls): 

10 seg = '<tr><td align="center">{}</td><td align="center">\ 
1 {}</td><td align="center">{}</td><tdalign="center">\ 
12 {}</td></tr>\n' .format(*locls) 

3 return seg 

14 fr = open("price2016.csv", "r") 

1 ls = [] 

16 for line in fr: 

7 line = line.replace("\n","") 

8 ls.append (line.split(",")) 

19 fr.close() 

20 | fw = open("price2016.htm]l", "w") 

21 fw.write (segl) 

22 | fw.write('<th width="25%">{}</th>\n<th 

23 | width="25%">{}</th>\n<th width="25%">{}</th>\n<th 

24 width="25%">{}</th>\n' .format (*ls[0])) 

25 fw.write (seg2) 


源 代码 7 一 13 
CV 格式 的 HTML 
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26 | for i in range(len(ls)-1): 
全 fw.write (fill data (ls[i+1])) 


28 | fw.write!(seg3) 
29 fw.close!() 


实例 代码 13.1 将 CSV 文件 中 的 数据 读 入 列表 ls， 然 后 通过 格式 化 字符 串 方法 
将 1s 中 的 内 容 写 入 HMTL 文件 。 运 行 结果 如 图 7.9 所 示 。 


思考 与 练习 
7.15 请 调研 HTML 语言 的 基本 语法 形式 。 
7.16 ”实例 代码 13.1 中 的 第 17 行 的 作用 是 什么 ? 
7.17 ”如何 修改 实例 代码 13.1， 使 得 生成 的 HTML 表格 的 表 头 是 淡 蓝 色 ? 


7.6 ”高 维 数据 的 格式 化 


Yo 


与 一 维 、 二 维 数据 不 同 ， 高 维 数据 能 展示 数据 间 更 为 复杂 的 组 织 关 系 。 为 了 保 
持 灵 活性 ， 表 示 高 维 数据 不 采用 任何 结构 形式 ， 仅 采用 最 基本 的 二 元 关系 ， 即 键 
值 对 。 

万 维 网 (WWW) 是 一 个 复杂 的 数据 组 织 体系 ， 它 通过 HTML 方式 链接 并 展示 
不 同类 型 数据 内 容 ， 采 用 XML 或 JSON 格式 表达 键 值 对 ， 形 成 数据 间 复 杂 的 结构 
关系 。 万 维 网 是 高 维 数据 最 成 功 的 典型 应 用 。 

JSON 格式 可 以 对 高 维 数据 进行 表达 和 存储 。JSON (JavaScript Object Notation ) 
是 一 种 轻 量 级 的 数据 交换 格式 , 易于 阅读 和 理解 .JSON 格式 表达 键 值 对 <key, value> 
的 基本 格式 如 下 ， 键 值 对 都 保存 在 双 引 号 中 : 


"key"” : "value" 

当 多 个 键 值 对 放 在 一 起 时 ，JSON 有 如 下 一 些 约定 。 
(1) 数据 保存 在 键 值 对 中 。 

(2) 键 值 对 之 间 由 运 号 分 隔 。 

(3) 大 括号 用 于 保存 键 值 对 数据 组 成 的 对 象 。 

(4) 方 括号 用 于 保存 键 值 对 数据 组 成 的 数组 。 

以 “本 书 作 者 ”JSON 数据 为 例 。 


"本 书 作者 " : [ 
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"单位 ” : "北京 理工 大 学 "” “}， 
{ " 瘦 民 ”: " 礼 "， 

"名字 ”: "的 "， 

"单位 ”: "北京 理工 大 学 "” )， 
{ "姓氏 ”:" 黄 "， 

"名 字 "” : "天 羽 "， 

"单位 ”: "北京 理工 大 学 ” 1} 


首先 它 是 一 个 键 值 对 ， 由 “本 书 作者 ”与 内 容 组 成 ， 由 于 存在 3 个 作者 ， 作 者 
之 间 采 用 逗号 分 隔 ， 作 者 之 间 是 对 等 关系 ， 形 成 一 个 数组 ， 采 用 方 括号 分 隔 ， 每 个 
作者 是 一 个 对 象 ， 采 用 大 括号 组 织 ， 因 为 对 象 中 包括 作者 的 姓氏 、 名 字 和 单位 ， 每 
一 项 都 是 一 个 键 值 对 ， 对 应 作者 的 一 个 属性 。 

采用 对 象 、 数 组 方式 组 织 起 来 的 键 值 对 可 以 表示 任何 结构 的 数据 ， 这 为 计算 机 
组 织 复杂 数据 提供 了 极 大 的 便利 。 目前, 万 维 网 上 使 用 的 高 维 数据 格式 主要 是 JSON 
和 XML, 本 书 建 议 采 用 JSON 格式 .格式 化 高 维 数据 采用 Python 语言 的 标准 库 json。 


! XML 格式 需要 成 对 的 标签 表示 键 值 对 . “本 书 作者 ”的 XML 描述 如 下 。 ! 


< 姓氏 > 沉 </ 姓 氏 >< 名 字 > 天 </ 名 字 >< 单 位 > 北京 理工 大 学 </ 单 位 > 


</ 本 书 作者 > 


XML 和 JSON 都 可 以 表达 高 维 数据 ， 但 XML 对 key 值 要 存储 两 次 
(<key></key>), 而 JSON 只 需要 存储 一 次 ， 且 在 数据 交换 时 产生 更 少 的 网 络 带 宽 和 
存储 需求 ， 因 此 相 比 XML 更 为 常用 。 


2 


;| < 姓氏 > 礼 </ 姓 氏 >< 名 字 > 欣 </ 名 字 >< 单 位 > 北京 理工 大 学 </ 单 位 > 
< 姓氏 > 黄 </ 姓 氏 >< 名 字 > 天 羽 </ 名 字 >< 单 位 > 北京 理工 大 学 </ 单 位 > | 


思考 与 练习 
7.18 ”思考 键 值 对 对 高 维 数据 构建 的 意义 。 
7.19 JSON 格式 中 大 括号 和 中 括号 的 作用 是 什么 ? 
7.20 思考 JSON 如 何 支 持 一 二 维 数据 表示 。 


7.7 模块 6: json 库 的 使 用 
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7.7.1 json 库 概述 


json 库 是 处 理 JSON 格式 的 Python 标准 库 ， 导 入 方式 如 下 : 


json 库 主要 包括 两 类 函数 : 操作 类 函数 和 解析 类 函数 。 操 作 类 函数 主要 完成 外 
部 JSON 格式 和 程序 内 部 数据 类 型 之 间 的 转换 功能 ;解析 类 函数 主要 用 于 解析 键 值 
对 内 容 。json 格式 包括 对 象 和 数组 ， 用 大 插 号 和 方 插 号] 表示， 分 别 对 应 键 值 对 
的 组 合 关 系 和 对 等 关系 。 使 用 json 库 时 需要 注意 json 格式 的 “对 象 ” 和 “数组 ” 概 
念 与 Python 语言 中 “字典 ”和 “列表 ”的 区 别 和 联系 。 一 般 来 说 ，JSON 格式 的 对 
象 将 被 json 库 解 析 为 字典 ，JSON 格式 的 数组 将 被 解析 为 列表 。 


7.7.2 json 库 解 析 


json 库 包 含 两 个 过 程 : 编码 (encoding) 和 解码 (decoding)。 编 码 是 将 Python 
数据 类 型 变换 成 JSON 格式 的 过 程 ， 解 码 是 从 JSON 格式 中 解析 数据 对 应 到 Python 
数据 类 型 的 过 程 。 本 质 上 ， 编 码 和 解码 是 数据 类 型 序列 化 和 反 序 列 化 的 过 程 。 


E> 证 列 化 


表 7.13 列 出 了 json 库 的 4 个 操作 类 函数 ， 其 中 dumpsO 和 loads0 分 别 对 应 编码 
和 解码 功能 。 
表 7.13 json 库 的 操作 类 函数 ( 共 人 4 个) 


json.dumps(obj, sort_keys= 
False, indent=None) 


json.loads(string) 将 JSON 格式 字符 串 转 换 为 Python 的 数据 类 型 ， 解 码 过 程 
json.dump(obj, fp, sort_keys= on. 

False, indent=None) dumps0 荔 能 一 至 ， 物 出 到 文件 各 

json.load(fp) 与 loads(0) 功 能 一 致 ， 从 文件 印 读 入 


json.dumps() 中 的 obj 可 以 是 Python 的 列表 或 字典 类 型 ， 当 输入 字典 类 型 时 ， 
dumps() 函 数 将 其 变 为 JSON 格式 字符 串 。 默 认 生成 的 字符 串 是 顺序 存放 的 ,sort_keys 
可 以 对 字典 元 素 按照 key 进行 排序 ， 控 制 输出 结果 。indent 参数 用 于 增加 数据 缩 进 ， 
使 得 生成 的 JSON 格式 字符 串 更 具有 可 读 性 。 
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尽管 json 库 还 有 很 多 丰富 的 功能 , 但 是 json 库 一 般 用 于 JSON 格式 和 其 他 类 型 
格式 转换 ， 所 以 ， 掌 握 基 本 用 法 即 可 。 


思考 与 练习 
7.21 json 库 的 dumpsO 函 数 的 sort_keys 参数 有 何 作用 ? 
7.22 ”判断 题 : json 库 的 dumps0) 函 数 将 Python 字典 类 型 变 成 字符 串 。 
7.23 ”判断 题 : json 库 的 dumps0 函 数 将 Python 列表 类 型 变 成 字符 串 。 


7.8 实例 14: CSV 和 JSON 格式 相互 转换 


ee 0 mp Sm m0 0 0 OD tm a ee 


= = =-==? 


CSV 格式 常 用 于 一 二 维 数据 表示 和 存储 ， 它 是 一 种 纯 文 本 形式 存储 表格 数据 的 
表示 方式 。JSON 也 可 以 表示 一 二 维 数据 。 在 网 络 信息 传输 中 ， 可 能 需要 统一 表示 
方式 ， 因 此 ， 需 要 在 CSV 和 JSON 格式 间 进 行 相互 转换 。 

以 price2016.csv 作为 输入 ， 和 希望 输出 的 JSON 格式 对 应 于 每 行 数据 如 下 : 


"同比 ": ii a1 i 7 
r 据 市 ”5 nat™" 

" 定 基 ": i 
"环比 ": nwI01.5" 


由 于 CSV 格式 和 JSON 格式 处 理 在 本 章 中 都 有 介绍 ， 这 里 仅 给 出 转换 的 完整 
程序 。 
将 CSV 格式 转换 成 JSON 格式 的 代码 如 下 : 
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2 
; 源 代码 7 一 14: 
SV 格式 向 JSON 


el14.1csv2json. 


实例 代码 14.1 


1 |#el4.lcsv2json.py 

2 | import json 

3 | fr = open("price2016.csv", "r") 

4 |1s = [] 

5 | For line in £r: 

6 line = line.replace("\n","") 

7 ls.append (line.split(',')) 

8 fr.close() 

9 | fw = open("price2016.json", "w") 
10 | for i in range(1, Len(1s)) : 
Ji ls[i] = dict(zip(ls[0], ls[i])) 
12 | json.dump(ls[1:] ,fw, sort keys=True, indent=4) 
13 | fw.close() 


其 中 ，zipO 是 一 个 内 置 函 数 ， 能 够 将 两 个 长 度 相 同 的 列表 组 合成 一 个 关系 对 ， 
例子 如 下 ， 该 函数 非常 适合 于 生成 键 值 对 。 


"usa0cNu6bada™: "120.7" 
"\u57ce\uS5e02":; "\u5317\u4eac", 
"Nushga\ as tas i214", 
"\u73af\u6bd4": "101.5" 


json 库 默 认 采 用 Unicode 编码 处 理 非 西 文字 符 ， 主 要 为 了 避免 网 络 传输 中 因 编 
码 方式 不 同 带 来 的 问题 。 可 以 通过 在 dumps0 函 数 中 修改 ensure_ascii 参数 默认 值 使 
json 库 输 出 中 文字 符 。 修 改 实例 代码 14.1 中 的 第 12 行 代码 : 


json.dump(ls[1:],fw, sort keys=True, indent=4, ensure ascii=False) 


程序 运行 后 的 完整 输出 结果 如 下 : 
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"同比 ": 
"城市 ”: 
" 定 基 ": 
"环比 ": 


"同比 ": 
"城市 ": 
" 定 基 ": 
"环比 ": 


"同比 : 
"城市 ": 
" 定 基 ": 
"环比 ": 


"同比 ": 
"城市 ": 
" 定 基 ": 
"环比 ": 


"同比 ": 
"城市 ": 
" 定 基 ": 
"环比 ": 


"同比 " " 
"城市 " : 
" 定 基 " : 
"环比 ": 


Wt 
"北京 ”， 

Ta, 
“Ol.5" 


We A 
"上 海 "， 
A 
01 


m9 
Le 
i A 
过 而 -3 


m1 a0 9 
"深圳 "， 
SP 
呵 025 


"0 
"沈阳 "， 

“ToL.e", 
T1000 


将 二 维 JSON 格式 数据 转换 成 CSV 格式 数据 的 代码 如 下 ， 供 读者 参考 。 


回 并 加 
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实例 代码 14.2 e14.2json2csv.py 
让 #14.2json2csv.py 
2 import json 
3 fr = open("price2016.json", "r") 
4 | ls = json.1load (fr) 
3 data = [ list(ls[0] .keys()) ] 
6 for item in ls: 
7 data.append (list(item.values())) 
8 fr.close() 
9 | fw = open ("price2016 from json.csv", "w") 
10 | for item in data: 
Mn fw.write(",".join(item) + "\n") 
12 fw.close() 


括 展 : Python 的 数据 类 型 转换 


表 7.14 给 出 了 Python 数据 类 型 转换 函数 ， 请 读者 比较 参考 。 


表 7.14 Python 的 数据 类 型 转换 函数 ( 共 13 个 ) 


函数 描述 
int(x [,base]) 将 字符 串 x 转换 为 一 个 整数 
! _float(x) 将 字符 串 x 转换 为 一 个 浮 点 数 
! complex(real [,imag]) 根据 real 和 imag 创建 一 个 浮 点 数 
' str(x) 将 对 象 x 转换 为 字符 串 
，_repr(obj) 将 对 象 obj 当 作 Python 语句 执行 , 返回 结果 的 字符 串 形式 
eval(str) 计算 字符 串 中 的 有 效 Python 表达 式 ， 返 回 结果 
:tuple(s) 将 序列 s 转换 为 一 个 元 组 
,_list(s) 将 序列 s 转换 为 一 个 列表 
' chr(x) 将 一 个 整数 转换 为 一 个 字符 
' unichr(x) 将 一 个 整数 转换 为 Unicode 字符 
， ord(x) 将 一 个 字符 转换 为 它 的 整数 值 
(hex(x) 将 一 个 整数 转换 为 一 个 十 六 进 制 字符 串 
oct(x) 将 一 个 整数 转换 为 一 个 八进制 字符 串 
思考 与 练习 


7.24 ”如 何 通 过 json 库 的 dumps0 函 数 输出 中 文字 符 ? 
7.25 ”zip0 函 数 的 作用 是 什么 ? 
7.26 思考 列表 和 字典 在 各 维度 数据 处 理 中 的 应 用 。 


本 章 主要 介绍 了 文件 的 输入 输出 操作 框架 ， 介 绍 了 PIL 库 并 使 用 PIL 库 演示 了 
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字符 画 绘制 实例 ， 进 一 步 介 绍 了 数据 的 维度 概念 和 多 维 数据 的 格式 化 处 理 方法 ， 演 
示 了 JSON 和 CSV 格式 相互 转化 以 及 CSV 的 HTML 格式 展示 等 方法 。 


7.1 Python 源 文件 改写 。 编 写 一 个 程序 ， 读 取 一 个 Python 源 程序 文件 ， 将 文 
件 中 所 有 除 保留 字 外 的 小 写字 母 换 成 大 写字 母 , 生成 后 的 文件 要 能 够 被 Python 解释 
器 正确 执行 。 

7.2 图像 文件 压缩 。 使 用 PIL 库 对 图 片 进行 等 比例 压缩 ,无 论 压缩 前 文件 大 小 
如 何 ， 压 缩 后 文件 小 于 10 KB。 

7.3 中文 字符 画 。 参 考 实例 12， 编 写 程序 合理 选取 中 文字 符 构造 字符 表 ， 生 
成 中 文字 符 画 。 

7.4 CSV 解析 。 改 编 实例 14， 使 得 对 CSV 的 转换 能 够 识别 并 保留 数据 内 部 的 
如 号 。 
7.5 制作 英文 学 习 词典 。 编 写 程序 制作 英文 学 习 词典 ， 词 典 有 3 个 基本 功能 : 
添加 、 查 询 和 退出 。 程 序 读 取 源 文件 路 径 下 的 txt 格式 词典 文件 ， 若 没有 就 创建 一 
个 。 词 典 文件 存储 方式 为 “英文 单词 中 文 单 词 ” 每 行 仅 有 一 对 中 英 释 义 。 程 序 会 
根据 用 户 的 选择 进入 相应 的 功能 模块 ， 并 显示 相应 的 操作 提示 。 当 添加 的 单词 已 存 
在 时 ， 显 示 “ 该 单词 已 添加 到 字典 库 ” 当 查 询 的 单词 不 存在 时 ， 显 示 “ 字 典 库 中 未 
找到 这 个 单词 ”。 用户 输 入 其 他 选项 时 ， 提 示 “ 输 入 有 误 ” 

7.6 ”修改 程序 练习 题 7.5 的 程序 ， 使 其 能 够 对 单词 添加 多 重 释 义 ， 不 同 释义 用 
逗号 分 开 。 
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本 部 分 从 程序 设计 方法 角度 讲解 利用 Python 语言 解决 完整 实际 问题 的 过 程 和 
方法 ， 分 别 在 图 形 艺术 、 科 学 计算 、 数 据 处 理 和 网 络 应 用 等 方面 给 出 具体 实例 并 介 
绍 各 领域 专业 第 三 方 库 的 使 用 ， 使 读者 理解 Python 语言 的 “模块 编程 ”思想 。 本 部 
分 的 学 习 目 标 是， 编写 100 行 左 右 “ 炫 酷 ( 库 )” 的 Python 程序 。 

本 部 分 包括 5 章 内 容 (第 8~10 章 、 附 录 B、 附 录 C)， 分 别 如 下 : 

第 8 章 程序 设计 方法 论 

第 9 章 科学 计算 和 可 视 化 

第 10 章 网 络 爬 虫 和 自动 化 

附录 B 人 机 接口 和 图 形 编程 

附录 C 数据 处 理 和 挖掘 

第 8 章 主要 讲解 程序 设计 方法 学 , 包括 计算 思维 、 自 顶 向 下 、 自 底 向 上 、Python 
第 三 方 库 安装 和 和 使用， 这 里 推荐 读者 了 解 计算 生态 和 模块 编程 思想 。 

第 9 章 主 要 面向 科学 计算 和 可 视 化 , 讲解 多 维 数据 运算 第 三 方 库 numpy 和 科学 
计算 可 视 化 库 matplotlib， 重 点 讲解 绘制 坐标 系 和 雷达 图 的 方法 。 

第 10 章 主 要 面向 互联 网 ， 讲 解 网 络 爬 虫 设计 原理 和 网 页 解析 方法 , 介绍 该 领域 
最 优秀 的 requests 库 和 beautifulsoup4 库 ， 在 卜 取 内 容 同 时 讲解 提交 内 容 方法 。 

附录 B 主要 面向 图 像 和 艺术 设计 ， 讲解 图 形 用 户 界面 的 编写 方法 及 图 形 艺术 的 
设计 与 实现 ， 重 点 介绍 最 优秀 的 第 三 方 库 PyQt5 和 标准 库 turtle。 

附录 C 主要 面向 数据 处 理 和 挖掘 ,讲解 利用 优秀 的 数据 挖掘 第 三 方 库 进 行 聚 类 、 
分 类 和 回归 等 程序 设计 ， 重 点 讲解 sklearn 库 及 3 个 重要 的 数据 挖掘 算法 的 使 用 。 

鉴于 读者 兴趣 不 同 ， 第 9~ 10 章 和 附录 B、C 的 内 容 可 以 采用 4 选 2 或 者 4 选 
3 方式 学 习 ， 这 4 章 内 容 中 只 有 附录 C 内 容 以 第 9 章 部 分 知识 为 基础 ， 其 他 内 容 无 
问 灵 ， 


MOOC 课程 | 
中 国 大 学 MOOC:i 
“Python 语言 程 : 


第 8 这 程序 设计 方法 论 


人 (和 寺 知 ， 坊 1 Python。 
Life is short. You need Python. 
一 一 布鲁斯 * 埃 克 尔 (Bruce Eckel) 
ANSIISO C++ 标准 委员 会 发 起 者 之 一 


© es > 
学 习 目 标 : 


' (1) 了 解 计 算 思维 的 概念 。 

(2) 掌握 自 顶 向 下 的 设计 方法 。 

: (3) 掌握 自 底 向 上 的 执行 过 程 。 

| (4) 了 解 计算 生态 和 模块 编程 思想 。 
(5) 掌握 Python 第 三 方 库 的 安装 方法 。 
(6) 掌握 Python 源 文 件 的 打包 方法 。 


SB 


* 


难得 学 会 了 Python 编程 ， 但 每 次 执行 代码 都 要 通过 IDLE 或 命令 行 。 满 怀 喜 悦 
地 想 跟 周围 朋友 分 享 代码 ， 却 发 现 跨 平 台 兼 容 出 了 问题 ， 一 万 点 伤害 ! 
有 没有 简单 方法 ， 既 可 以 将 程序 打包 为 可 执行 文件 又 可 以 在 多 平台 下 良好 


兼容 ? 
当然 有 ， 本 章 将 介绍 神器 pyinstaller 库 ， 教 你 如 何 制作 程序 小 包 豪 。 
人 生 若 短 ， 快 用 Python， 盲 目 苦 干 不 如 合理 偷懒 。 
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“要 雪 计算 思维 是 人 类 科学 思维 活动 的 重要 组 成 部 分 ， 与 过 辑 思 维和 实证 ， 
; 思维 同等 重要 


2006 年 , 时 任 美 国 卡 内 基 - 梅 隆 大 学 计算 机 系 主任 的 周 以 真 (Jeannette M. Wing) 
教授 提出 了 计算 思维 (Computational Thinking) 概念 ， 这 个 概念 第 一 次 从 思维 层面 
阐述 了 运用 计算 机 科学 的 基础 概念 求解 问题 、 设 计 系 统 和 理解 人 类 行为 的 过 程 。 程 
序 设计 是 实践 计算 思维 的 重要 手段 ， 本 书 之 前 的 各 个 实例 虽然 问题 不 同 ， 但 都 采用 
了 同一 种 解决 思路 : 抽象 实际 问题 的 计算 特性 ， 利 用 计算 机 求解 。 计 算 思 维 的 本 质 
是 抽象 (Abstraction) 和 自动 化 Automation ) 。 

计算 思维 是 人 类 科学 思维 活动 的 重要 组 成 部 分 。 人 类 在 认识 世界 、 改 造 世界 过 
程 中 表现 出 3 种 基本 的 思维 特征 : 以 实验 和 验证 为 特征 的 实证 思维 ， 以 物理 学 科 为 
代表 ;以 推理 和 演绎 为 特征 的 逻辑 思维 ， 以 数学 学 科 为 代表 ; 以 设计 和 构造 为 特征 
的 计算 思维 ， 以 计算 机 学 科 为 代表 。 理 解 计 算 思 维 ， 除 了 认识 概念 本 身 ， 还 要 清晰 
地 认识 它 的 时 代 特 性 。 

计算 思维 并 非 天 生 就 存在 且 清 晰 ， 人 类 探索 自然 几 千 年 中 仅 有 十 分 “ 腾 胰 ”的 
计算 概念 。 即 使 1946 年 第 一 台 计 算 机 ENIAC 的 诞生 ， 也 并 没有 让 人 类 对 计算 有 重 
新 认识 ， 更 难 从 思维 角度 理解 和 认识 计算 。 然 而 ， 随 后 计算 机 技术 的 快速 发 展 改 变 
了 人 类 的 认 知 。 摩 尔 定律 和 网 络 技术 在 极 短 时 间 内 让 计算 机 以 极 低 的 成 本 走 入 了 人 
类 日 常生 活 ， 大 量 传统 行业 通过 信息 化 改造 大 幅 提升 了 效率 ， 显 著 的 变化 让 人 类 意 
识 到 计算 机 的 强大 力量 。 人 类 已 经 开始 依赖 计算 机 带 来 的 丰富 计算 能 力 ， 思 维 方式 
也 在 逐渐 演变 。2006 年 ， 周 以 真 教授 深刻 阐述 了 计算 思维 的 概念 。 可 以 看 出 ， 计 算 
思维 是 计算 机 科学 发 展 到 一 定 程度 而 提出 的 ， 它 是 人 类 逐渐 意识 到 计算 机 解决 问题 
的 强大 能 力 后 而 自然 产生 的 思维 模式 , 具有 显著 的 时 代 特 性 。 从 内 涵 角 度 讲 , 以 “ 抽 
象 和 自动 化 ”为 特点 的 计算 思维 必然 以 当今 计算 机 科学 与 技术 的 发 展 为 前 提 ， 对 计 
算 思 维 的 认识 要 与 计算 机 科学 发 展 阶段 相 适应 。 

在 程序 设计 范畴 ， 计 算 思 维 主要 反映 在 理解 问题 的 计算 特性 、 将 计算 特性 抽象 
为 计算 问题 、 通 过 程序 设计 语言 实现 问题 的 自动 求解 等 几 个 方面 。 

拓展 : ENIAC 


: ENIAC( Electronic Numerical Integrator And Computer, 电子 数字 积分 计算 机 )， 
' 是 世界 上 第 一 台 通用 计算 机 ， 于 1946 年 诞生 于 美国 宾夕法尼亚 大 学 摩尔 实验 室 。， 
| ' 尽管 ENIAC 占 地 面积 约 170 平方 米 , 重 达 30t, 它 比 当 时 最 快 的 计算 设备 速度 快 ， 


' 1 000 位 ,这 样 | 惊人 的 计算 性 能 在 随后 半 个 多 世纪 里 改变 了 整个 世界 ， 原始 创新 ， 


第 8 章 程序 设计 方法 论 217 


思考 与 练习 

8.1 计算 思维 的 本 质 是 什么 ? 

8.2 ” 简 述 通过 计算 思维 解决 问题 的 基本 过 程 。 

8.3 ”下列 实 例 中 是 计算 思维 的 应 用 的 是 《 ) 
A. 通过 多 次 的 实验 与 统计 ， 总 结 事件 发 生 的 规律 
B. 通过 复杂 的 推导 ， 验 证 了 数学 公式 的 正确 性 
C. 高 考 中 ， 算 出 了 一 道 很 难 的 数学 题 
D. 对 一 类 问题 进行 数学 建 模 ， 并 通过 程序 解决 问题 


8.2 ”实例 15: 体育 竞技 分 析 


模拟 是 用 来 解决 现实 世界 问题 的 重要 手段 和 技术 。 计算 机 可 以 通过 模拟 现实 世 
界 的 运行 过 程 提供 一 般 情况 下 无 法 获得 的 信息 ， 使 用 计算 机 模拟 解决 问题 的 实例 包 
括 天 气 预测 、 飞 机 设计 、 电 影 特效 、 核 试验 甚至 军事 对 抗 等 。 如 果 不 采用 计算 机 模 
拟 ， 这 些 应 用 则 需要 极其 复杂 的 实施 过 程 ， 往 往 代 价 巨大 。 即 使 很 简单 的 模拟 也 可 
以 揭示 一 些 困 难 问题 的 本 质 规律 。 

体育 竞技 像 其 他 竞技 一 样 为 合作 、 对 抗 和 策略 提供 了 一 个 施展 的 平台 。 体 育 竞 
技 历史 悠久 ， 中 国 古 代 就 有 田鼠 赛马 的 故事 。 到 了 现代 ， 高 水 平 竞技 活动 中 双方 实 
力 差距 越 来 越 小 ， 胜 负 往 往 在 毫 厘 间 。 因 此 ， 体 育 竞技 分 析 作为 挖掘 并 解释 竞技 背 
后 规律 和 现象 的 手段 逐渐 成 为 了 人 们 关注 的 重要 问题 。 现实 中 的 例子 , 一 个 朋友 A， 
他 非常 喜欢 打 网 球 ， 多 年 经 历 和 体育 精神 使 A 养 成 了 一 个 习惯 ， 他 总 喜欢 和 那些 比 
他 强 一 点 的 人 比赛 。 为 此 ， 他 经 常 被 完胜 ， 输 掉 了 绝 大 多 数 比赛 。A 总 是 质疑 这 里 
面 是 运气 原因 、 状 态 原因 或 不 可 控 因 素 。 真 是 这 样 吗 ? 从 直观 感受 来 看 ， 水 平 稍 好 
的 球员 似乎 会 赢得 稍 多 ， 比 赛 结果 不 会 相差 悬殊 。A 与 其 他 人 比赛 仅 有 一 些 弱势 ， 
是 不 应 该 总 被 完胜 的 。 这 个 生活 中 的 直观 例子 可 以 反映 深刻 问题 。 排 除 一 些 主观 因 
素 , 例如 与 A 比赛 的 其 他 人 也 许 水 平 比 A 高 很 多 ， 只 是 他 们 不 承认 而 已 。 本 节 将 通 
过 编写 一 个 计算 机 程序 来 模拟 体育 竞技 的 某 些 属性 环节 ， 进 而 模拟 上 千 场 不 同 水 平 
级 别 对 手 之 间 的 比赛 ， 揭 示 并 分 析 体 育 竞技 规律 。 

托 展 : 模拟 和 仿真 
模拟 (simulation ) 是 抽象 原 系统 菜 些 行为 特征 并 用 另 一 系统 来 表示 这 些 特征 ， 
的 过 程 ， 通 常用 于 设计 初期 的 模型 验证 。 仿 真 (emulation ) 则 更 进一步 ， 需 要 模 ， 
| 仿 系统 真实 能 做 的 事情 ， 接 收 同样 的 数据 ， 获 得 同样 的 结果 ，: 只 不 过 实现 的 过 程 ， 
' 不 同 。 仿 真一 般 用 于 处 理 兼容 性 问题 或 在 资源 有 限 的 条 件 下 实现 系统 原型 。 | 
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本 节 使 用 一 种 从 各 种 球 类 比赛 中 抽象 的 一 般 规则 ， 规 则 定义 如 下 : 两 个 球员 在 
一 个 有 4 面 边界 的 场地 上 用 球拍 击 球 。 开 始 比赛 时 ， 其 中 一 个 球员 首先 发 球 。 接 下 
来 球员 交替 击 球 ， 直 到 可 以 判定 得 分 为 止 ， 这 个 过 程 称 为 回合 。 当 一 名 球员 未 能 进 
行 一 次 合法 击 打 时 ， 回 合 结束 。 未 能 打 中 球 的 球员 输 掉 这 个 回合 。 如 果 输 掉 这 个 回 
合 的 是 发 球 方 ， 那 么 发 球 权 交 给 另 一 方 ， 如 果 输 掉 的 是 接 球 方 ， 则 仍然 由 这 个 回合 
的 发 球 方 继续 发 球 。 总 之 ， 每 回合 结束 ， 由 赢得 该 回合 的 一 方 发 球 。 球 员 只 能 在 他 
们 自己 的 发 球 局 中 得 分 。 首 先 达 到 15 分 的 球员 赢得 一 局 比赛 。 

在 计算 机 模拟 中 ， 运 动员 的 能 力 级 别 将 通过 发 球 方 赢 得 本 回合 的 概率 来 表示 。 
因此 ， 一 个 0.6 概率 的 球员 可 以 在 他 的 发 球 局 有 60% 的 可 能 性 赢得 1 分 。 程 序 首 先 
接收 两 个 球员 的 水 平 值 ， 然 后 利用 这 个 值 采 用 概率 方法 模拟 多 场 比赛 。 程 序 最 后 会 
输出 比赛 运行 结果 。 

该 问题 的 IPO 描述 如 下 。 

输入 : 两 个 球员 (球员 A 和 B) 的 能 力 概率 ， 模 拟 比赛 的 场次 

处 理 : 模拟 比赛 过 程 

输出 : 球员 A 和 B 分 别 赢 得 球赛 的 概率 

抽象 这 个 问题 时 ， 将 球员 失误 、 犯 规 等 可 能 性 一 并 考虑 在 能 力 概 率 中 ， 在 每 局 
比赛 中 ,球员 A 先 发 球 。 一 个 期 望 的 输出 结果 如 下 。 

模拟 比赛 数量 : 500 

球员 A 获胜 场次 : 268 (53.6%) 

球员 B 获胜 场次 : 232 (46.4%) 

体育 竞技 分 析 程 序 需要 面 对 不 确定 事件 。 一 个 球员 赢得 了 50% 的 发 球 权 ， 并 不 
意味 着 剩 下 的 每 一 局 他 都 是 胜利 者 ， 这 更 像 是 掷 硬 币 。 

解决 体育 竞技 分 析 问 题 似乎 与 之 前 所 解决 的 问题 有 所 不 同 ， 因 为 其 处 理 过 程 并 
不 是 仅 靠 一 个 算法 完成 ， 而 是 需要 稍微 复杂 的 程序 结构 。 虽 然 该 问题 在 Python 中 实 
现 并 不 复杂 ， 但 对 该 问题 设计 的 讨论 有 助 于 理解 程序 中 的 一 些 重要 方法 。8.3 节 将 
结合 这 个 例子 介绍 自 顶 向 下 的 设计 方法 和 自 底 向 上 的 执行 过 程 。 


思考 与 练习 
8.4 思考 体育 竞技 分 析 实 例 中 体现 的 计算 思维 思想 。 
8.5 思考 还 有 哪些 应 用 使 用 了 计算 机 模拟 。 


8.3 目 顶 向 下 和 自 底 向 上 


-0770--7007507 


一 个 解决 复杂 问题 行 之 有 效 的 方法 被 称 作 自 项 向 下 的 设计 方法 ， 其 基本 思想 是 
以 一 个 总 问题 开始 ， 试 图 把 它 表达 为 很 多 小 问题 组 成 的 解决 方案 。 再 用 同样 的 技术 
依次 攻破 每 个 小 问题 ， 最 终 问题 变 得 非常 小 ， 以 至 于 可 以 很 容易 解决 。 然 后 只 需 把 
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所 有 的 碎片 组 合 起 来 ， 就 可 以 得 到 一 个 程序 。 
8.3.1 自 顶 向 下 设计 


1. 顶层 设计 

自 顶 向 下 设计 中 最 重要 的 是 顶层 设计 。 以 体育 竞技 分 析 为 例 , 可 以 从 问题 的 了 了 O 
描述 开始 。 大 多 数 程 序 都 可 以 将 IPO 描述 直接 用 到 程序 结构 设计 中 ， 体 育 竞技 分 析 
从 用 户 处 得 到 模拟 参数 ， 最 后 输出 结果 。 下 面 是 一 个 基础 设计 的 4 个 步骤 。 

步骤 1: 打印 程序 的 介绍 性 信息 。 

步骤 2: 获得 程序 运行 需要 的 参数 ， 即 probA、probB、n。 

步骤 3: 利用 球员 A 和 B 的 能 力 值 probA 和 probB， 模 拟 n 次 比赛 。 

步骤 4: 输出 球员 A 和 B 获胜 比赛 的 场次 及 概率 。 

这 个 基础 设计 从 IPO 描述 获得 ， 可 以 作为 自 项 向 下 设计 的 顶层 设计 。 

步骤 1 输出 一 些 介绍 信息 , 针对 提升 用 户 体验 十 分 有 益 。 下面 是 这 个 步骤 的 Python 
代码 ， 顶 层 设计 一 般 不 写 出 具体 代码 ， 仅 给 出 函数 定义 ， 其 中 ，printIntro(0) 函 数 打 
印 一 些 必要 的 说 明 。 


1 | def main(): 
2 | PzintIntro() 


| 


步骤 2 获得 用 户 输入 。 通 过 函数 将 输入 语句 及 输入 格式 等 细节 封装 或 隐藏 ， 只 
需要 假设 程序 如 果 调 用 了 getInputs() 函 数 即 可 获取 变量 probA、probB 和 na 的 值 。 这 
个 函数 必须 为 主 程序 返回 这 些 值 ， 截 至 第 2 步 ， 全 部 代码 如 下 : 


1 def main() : 
2 PrintIntro() 
3 ProbA, probB, n = getInpPuts () 


步骤 3 需要 使 用 probpA、probB 模拟 n 场 比赛 。 此 时 ， 可 以 采用 步骤 2 的 类 似 
方法 ， 设 计 一 个 simNGames0 函 数 来 模拟 n 场 比 赛 ， 并 返回 结果 。 按 照 体育 竞技 问 
题 的 要 求 ， 该 函数 需要 模拟 比赛 ， 并 给 出 球员 A 和 球员 B 赢得 比赛 的 结果 。 截 止步 
骤 3， 程 序 的 Python 代码 如 下 : 


[eg main(): 


1 

2 PrintIintro () 

3 | ProbA, probB, n = getInputs() 
4 


| winsA, winsB = simNGames (n, probA, probB) 
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步骤 4 输出 结果 ， 设 计 思 想 类 似 ， 仍 然 只 规划 功能 和 函数 ， 代 码 如 下 : 


def main(): 
PrintIintro() 
ProbA, probB, n = getInputs() 
winsA, winsB = simNGames (n, probA, ProbB) 


printSummary (winsA, winsB) 


WD 


至 此 ， 体 育 竞技 分 析 问 题 的 程序 框架 已 经 清晰 ， 但 这 仅 是 框架 ，mainO 函 数 并 
没有 做 什么 。 原 问题 被 划分 为 了 4 个 独立 的 函数 : printIntroO0、getInputs()、simNGames() 
和 printSummary()。 这 些 函 数 的 名 称 、 输 入 参数 和 预期 返回 值 都 已 经 确定 。 这 个 分 
解 过 程 十 分 有 益 ， 因 为 它 让 程序 员 在 这 一 步 不 必 关 心 具 体 细节 而 专心 考虑 程序 的 结 
构 设计 。 

2. 第 nn 层 设计 

经 过 顶层 设计 ，main() 函 数 成 为 体育 竞技 分 析 的 顶层 结构 ， 上 述 设计 可 以 表示 
为 图 8.1， 其 中 每 层 按 照 从 左 至 右 的 顺序 执行 ， 每 个 函数 用 一 个 矩形 表示 ， 连 接 两 
个 矩形 的 线 表示 上 面 函数 对 下 面 函数 的 调用 关系 。 在 信息 流 方面 ， 箭 头 和 注释 表示 
函数 之 间 的 输入 和 输出 。 


p> a a 0 MN 


pa winsB 
图 8.1 体育 竞技 分 析 程 序 结构 图 : 顶层 设计 


每 层 设计 中 ， 参 数 和 返回 值 如 何 设计 是 重点 ， 其 他 细节 可 以 暂时 忽略 。 确 定 事 
件 的 重要 特征 而 忽略 其 他 细节 过 程 称 为 抽象 。 抽 象 是 一 种 基本 设计 方法 ， 自 顶 向 下 
的 设计 过 程 可 以 看 作 是 发 现 功 能 并 抽象 功能 的 过 程 。 自 顶 向 下 设计 的 第 二 阶段 是 实 
现 或 进一步 抽象 第 2 层 函 数 。 

printIntro0) 函 数 应 该 输出 一 个 程序 介绍 ， 这 个 功能 的 Python 代码 如 下 ， 这 个 函 
数 由 Python 基本 表达 式 组 合 ， 不 增加 或 改变 程序 结构 。 


1 | def PrintIntro() : 
2 Print ("这 个 程序 模拟 两 个 选手 A 和 B 的 某 种 竞技 比赛 ") 
3 Print ("程序 运行 需要 A 和 B 的 能 力 值 (以 0 到 1 之 间 的 小 数 表示 》〉") 


getInputs() 函 数 根据 提示 得 到 3 个 需要 返回 主 程序 的 值 ， 代 码 如 下 : 
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def getInPuts() : 
a = eval (input ("请 输入 选手 A 的 能 力 值 (0-1) : ")) 
b = eval (input ("请 输入 选手 B 的 能 力 值 (0-1) : ")) 
ns eval (input ("模拟 比赛 的 场次 : we 


return a, b, n 


[6 人 WP 畏 


simNGames() 函 数 是 整个 程序 的 核心 ， 其 基本 思路 是 模拟 场 比赛 ， 并 跟踪 记 
录 每 个 球员 赢得 了 多 少 比 赛 。“ 模 拟 n 场 比赛 ”直观 感受 像 一 个 计数 循环 , 而 跟踪 记 
录 获 胜 场次 更 像 计 数 过 程 。 这 是 一 个 相当 直观 且 粗 粒度 的 设计 ， 类 似 顶层 设计 ， 其 
Python 代码 如 下 ; 


def simNGames (n, probA, probB): 
winsA, winsB = 0, 0 
for i in range(n): 
scoreA, scoreB = simOneGame (ProbA, ProbB) 
if scoreA > scoreB: 
winsA += 1 
else: 
WinsB += 1 


‘OO mA WN PP 


return winsA, winsB 


[en 
已 


代码 中 设计 了 simOneGame() 函 数 , 用 于 模拟 一 场 比赛 , 这 个 函数 需要 知道 每 个 
球员 的 概率 ， 返 回 两 个 球员 的 最 终 得 分 ， 图 8.2 给 出 了 这 个 设计 对 整体 结构 的 更 新 。 
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图 8.2 体育 竞技 分 析 程 序 结构 图 : 第 三 阶段 


接 下 来 需要 实现 simOneGame0) 函 数 。 为 了 模拟 一 场 比赛 , 需要 根据 比赛 规则 来 
编写 代码 ,两 个 球员 A 和 B 持续 对 攻 直 至 比赛 结束 。 可 以 采用 无 限 循环 结构 直到 比 
赛 结束 条 件 成 立 。 同 时 ， 需 要 跟踪 记录 比赛 得 分 ， 保 留 发 球 局 标记 ， 总 之 ， 尽 可 能 
详细 地 模拟 比赛 过 程 。 在 模拟 比赛 的 循环 中 ， 需 要 考虑 单一 的 发 球 权 和 比分 问题 ， 
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通过 随机 数 和 概率 ， 可 以 确定 发 球 方 是 否 赢得 了 比分 (random() < prob)。 如 果 球 员 
A 发 球 ， 那么 需要 使 用 A 的 概率 ， 接 着 根据 发 球 结果 ， 更 新 是 球员 A 得 分 还 是 将 球 
权 交 给 球员 B。 该 函数 的 代码 如 下 : 


上 记 
上 


记忆 
Rw N 


def simOneGame (probA, probB): 
scoreA, scoreB = 0, 0 
serving = "A" 
while not gameOver (scoreA, scoreB): 
if serving == "A": 
if random() < probaA: 
scoreA += 1 
else: 
serving="B" 
else: 
if random() < probB: 
scoreB += 1 
else: 
serving="A" 
return scoreA, scoreB 


这 里 进一步 设计 了 gameOver() 函 数 ， 用 来 表示 一 场 比 赛 结束 的 条 件 ， 对 于 不 同 
体育 比赛 结束 条 件 可 能 不 同 , 封 装 该 函数 有 助 于 简化 根据 不 同 规则 修改 函数 的 代价 ， 
提高 代码 可 维护 性 。gameOver0 函 数 跟踪 分 数 变化 并 在 比赛 结束 时 返回 True， 未 结 
束 则 返回 False。 然 后 继续 循环 的 其 余部 分 。 图 8.3 是 程序 新 的 结构 图 。 
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图 8.3 体育 帝 技 分 析 程 序 结构 图 : 第 三 阶段 


根据 比赛 规则 ， 当 任意 一 个 球员 分 数 达 到 15 分 时 比赛 结束 。gameOver() 函 数 实 
现代 码 如 下 : 
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1 | def gameOver (a,b): 
2 return a==15 or b==15 


最 后 是 printSummary0) 函 数 ， 其 Python 代码 如 下 : 


def printSummary (winsA, winsB): 
n = winsA + winsB 
print ("竞技 分 析 开 始 ， 共 模拟 {} 场 比赛 " .format (n)) 
print ("选手 A 获胜 {} 场 比赛 ， 占 比 {:0.1%}".format (winsA, winsA/n)) 
print ("选手 B 获胜 {} 场 比赛 ， 占 比 { :0.1%}".format (winsB, winsB/n)) 


DP 


将 上 述 所 有 代码 放 在 一 起 ， 形 成 了 实例 代码 15.1。 


实例 代码 15.1 el5.1MatchAnalysis.py 

J #e1l5.1MatchAnalysis.py 

2 #el15 .1Matchanalysis.PY 

3 from zandom import random 

4 def PintIntro() : 

5 print ("这 个 程序 模拟 两 个 选手 A 和 B 的 某 种 竞技 比赛 ") 
6 print〈" 程 序 运 行 需要 A 和 BB 的 能 力 值 ( 以 0 到 1 之 间 的 小 数 表 示 )") 
7 def getIinputs () : 

8 a=eval (input ("请 输入 选手 A 的 能 力 值 (0-1) : ") ) 
9 =eval (input ("请 输入 选手 B 的 能 力 值 (0-1) : ") ) 
10 n=eval (input ("模拟 比赛 的 场次 : ") ) 

1 return a, b, n 

12 | def simNGames (n, probA, probB) : 

13 winsA, winsB=0,0 

14 for i in range(n): 

15 scoreA, scoreB=simOneGame (probA, probB) 
16 if scoreA>scoreB: 

:Ms winsA += 1 

18 else: 

19 winsB += 1 

20 return winsA, winsB 

1 def gameOver (a, b): 

22 return a==15 or b==15 

疾 33 def simOneGame (probA, probB): 

24 scoreA, scoreB = 0, 0 

25 serving = "A" 

26 while not gameOver (scoreA, scoreB): 

27 if serving == "A": 
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28 if random() < probA: 

29 SCoreR += 1 

30 else: 

31 serving="B" 

32 else: 

33 if random() < probB: 

34 scoreB += 1 

35 else: 

36 serving="A" 

3 return scoreA, scoreB 

38 | def printSummary (winsA, winsB): 

39 n=winsAtwinsB 

40 print ("竞技 分 析 开 始 ， 共 模拟 {} 场 比赛 " .format (n)) 

41 print ("选手 A 获胜 {} 场 比赛 ， 占 比 {:0.1%}".format (winsA, winsA/n)) 
42 print ("选手 B 获胜 {} 场 比赛 ， 占 比 {:0.1%]}".format (winsB, winsB/n)) 
43 | def main(): 

44 printIintro() 

45 ProbA, ProbB, n = getInPuts () 

46 winsA, winsB = simNGames (n, PIrOobA, ProbB) 

47 printSummary (winsA, winsB) 


48 | main() 


上 述 代 码 执 行 结果 如 下 : 


最 后 再 回 到 体育 竞技 分 析 问 题 ， 通 过 模拟 方法 分 析 球 员 之 间 能 力 的 微小 差异 带 
来 的 比赛 结果 不 同 ， 是 否 会 产生 能 力 差别 小 却 导 致 比赛 结果 一 边 倒 的 现象 ? 假设 A 
在 发 球 局 赢得 了 45% 比 赛 ， 而 他 的 对 手 B 发 球 局 比 他 多 赢 了 5%。 结 果 显 示 ， 尽 管 
能 力 上 只 有 很 小 的 差距 〈5%)， 但 是 A 大 约 需要 经 历 3 场 比赛 才能 赢 一 场 ， 他 赢得 
一 场 3 局 或 5 局 的 比赛 机 会 十 分 避 落 。 进 一 步 地 ， 可 以 将 这 个 程序 扩展 为 羽毛 球 、 
乒乓 球 、 网 球 等 多 种 模式 ， 可 以 找到 体育 竞技 规律 。 当 然 ， 深 入 探讨 竞技 规律 的 前 
提 是 参赛 选手 水 平 差别 不 大 ， 所 发 现 的 规律 将 有 助 于 弥补 短 板 ， 类 似 中 国 男 足 与 巴 
西 男 足 的 竞技 规律 是 没 必要 探讨 的 。 

3. 设计 过 程 总 结 

本 结合 体育 竞技 实例 介绍 了 自 项 向 下 的 设计 过 程 。 从 问题 输入 输出 确定 开始 ， 
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整体 设计 逐渐 向 下 进行 。 每 一 层 以 大 体 算法 描述 开始 ， 然 后 逐步 细 化 成 代码 ， 细 节 
被 函数 封装 ， 整 个 过 程 可 以 概括 为 以 下 4 个 步 又 。 

步骤 1: 将 算法 表达 为 一 系列 小 问题 。 

步骤 2: 为 每 个 小 问题 设计 接口 。 

步骤 3: 通过 将 算法 表达 为 接口 关联 的 多 个 小 问题 来 细 化 算法 。 

步骤 4: 为 每 个 小 问题 重复 上 述 过 程 。 

自 顶 向 下 设计 是 一 种 开发 复杂 程序 最 具 价 值 的 设计 理念 和 工具 ， 设 计 过 程 自 然 
且 简 单 ， 自 顶 向 下 设计 通过 封装 实现 抽象 ， 利 用 了 模块 化 设计 的 思想 。 


8.3.2 自 底 向 上 执行 


程序 编写 后 ， 需 要 经 过 测试 过 程 。 对 于 较 小 规模 程序 ， 直 接 运行 即 可 。 但 对 于 
稍微 大 规模 的 程序 ， 需 要 特殊 方法 应 对 测试 问题 。 就 像 自 项 向 下 设计 ， 每 次 只 设计 
程序 的 一 部 分 比 一 下 子 解 决 整个 问题 更 容易 ， 开 展 测试 的 更 好 办 法 也 是 将 程序 分 成 
小 部 分 逐个 测试 。 对 于 Python 语言 ， 执 行 和 测试 含义 相同 ， 本 书 将 交替 使 用 这 两 个 
词语 ， 不 作 区 分 。 

执行 中 等 规模 程序 的 最 好 方法 是 从 结构 图 最 底层 开始 ， 而 不 是 从 顶部 开始 ， 然 
后 逐步 上 升 。 或 者 说 ， 先 运行 和 测试 每 一 个 基本 函数 ， 再 测试 由 基础 函数 组 成 的 整 
体 函 数 ， 这 样 有 助 于 定位 错误 。 在 体育 竞技 分 析 实 例 中 ， 参 考 图 8.3， 可 以 从 
gameOver() 函 数 开始 测试 。Python 解释 器 提供 import 保留 字 辅 助 开 展 单元 测试 ， 语 
法 格式 如 下 : 


import < 源 文 件 名 称 > 


这 里 需要 注意 ，import 要 求 源 文件 名 称 中 不 能 出 现 英文 句号 〈.)， 因 此 ， 需 要 
对 el15.1MatchAnalysis.py 文件 修改 名 称 ， 这 里 改 为 e151MatchAnalysis.py。 之 后 ， 
可 以 对 gameOver0 函 数 进行 单元 测试 ， 代 码 如 下 : 


通过 输入 比赛 分 数 可 以 测试 gameOver() 函 数 的 执行 结果 ， 初 步 测 试 说 明 
gameOver() 函 数 是 正确 的 。 可 以 进一步 测试 simOneGame() 函 数 ， 代 码 如 下 : 
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注意 到 当 概 率 相 等 时 ， 比 分 也 十 分 接近 。 当 概率 相差 很 远 时 ， 比 分 则 成 压倒 性 
趋势 。 这 与 该 函数 的 预期 结果 是 相符 合 的 。 

通过 继续 进行 这 样 的 单元 测试 可 以 检测 程序 中 的 每 个 函数 。 独 立 检验 每 个 函数 
更 容易 发 现 错误 。 通 过 模块 化 设计 可 以 分 解 问题 使 编写 复杂 程序 成 为 可 能 ， 通 过 单 
元 测试 方法 分 解 问题 使 运行 和 调试 复杂 程序 成 为 可 能 。 自 顶 向 下 和 自 底 向 上 贯穿 程 
序 设计 和 执行 的 整个 过 程 。 


有 秘 再 量 软件 开发 模型 


| 括 需 求 、 设计、 编码 和 测试 等 阶段 ， 有 时 也 包括 维护 阶段 。 软 件 开发 模型 能 清晰 、| 
' 直观 地 表达 软件 开发 全 过 程 ， 明 确 规定 了 要 完成 软件 的 主要 活动 和 任务 ， 用 来 作 ， 
! 为 软件 项 目 工作 的 基础 。 对 于 不 同 的 软件 系统 ， 可 以 采用 不 同 的 开发 方法 ， 使 用 | 
不 同 的 编程 语言 ， 组 织 不 同 技能 的 人 员 ， 运 用 不 同 的 管理 方法 等 。 1 


记忆 二 EL 一 一 一 三 


1 

' 

' 
< 


思考 与 练习 
8.6 ”什么 是 自 顶 向 下 设计 ? 什么 是 自 底 向 上 执行 ? 两 者 有 何 关系 ? 
8.7 ” 自 顶 向 下 设计 的 本 质 是 什么 ? 
8.8 ”下 面 能 支持 自 顶 向 下 设计 方法 的 是 ( pe 
A. 对 象 B. 循环 结构 C. 函数 D. 过 程 


8.4 模块 7: pyinstaller 库 的 使 用 


”要 大 :pyinstaller 是 一 个 将 Python 语言 脚本 ( .py 文件 ) 打包 成 可 执行 文件 
! 的 第 三 方 库 ， 可 用 于 Windows、Linux、Mac OS 义 等 操作 系统 ， 


DE 


ss 


8.4.1 pyinstaller 概述 


pyinstaller 是 一 个 十 分 有 用 的 第 三 方 库 ， 它 能 够 在 Windows、Linux、Mac OS X 
等 操作 系统 下 将 Python 源 文件 打包 , 通过 对 源 文件 打包 ,Python 程序 可 以 在 没有 安 
装 Python 的 环境 中 运行 ， 也 可 以 作为 一 个 独立 文件 方便 传递 和 管理 。pyinstaller 需 
要 在 命令 行 〈 控 制 台 ) 下 用 pip 工具 安装 ， 代 码 如 下 : 
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pyinstaller 的 官方 网 站 网 址 为 http://www.pyinstaller.org/。 

pyinstaller 库 会 自动 将 pyinstaller 命令 安装 到 Python 解释 器 目录 中 ， 与 pip 或 
pip3 命令 路 径 相 同 ， 因 此 可 以 直接 使 用 。 使 用 pyinstaller 库 十 分 简单 ， 以 实例 2 的 
实例 代码 2.3 为 例 , 在 Windows 平台 的 命令 行 中 输入 Python 源 文件 名 称 ， 可 以 使 用 
相对 路 径 或 绝对 路 径 ， 代 码 如 下 。 

请 注意 ， 由 于 pyinstaller 不 支持 源 文件 名 中 有 英文 句号 〈.) 存在 ， 请 将 实例 代 
码 2.3 文件 改 为 py， 并 假设 dpython.py 文件 在 D:\codes 目录 中 。 


执行 完毕 后 ， 源 文件 所 在 目录 将 生成 dist 和 build 两 个 文件 夹 。 其 中 ，build 目 
录 是 pyinstaller 存储 临时 文件 的 目录 ， 可 以 安全 删除 。 最 终 的 打包 程序 在 dist 内 音 
的 dpython 目录 中 。 目 录 中 其 他 文件 是 可 执行 文件 dpython.exe 的 动态 链接 库 。 

可 以 通过 -F 参数 对 Bipn 源 文件 生成 一 个 独立 的 可 执行 文件 ， 代 码 如 下 : 


执行 后 在 dist 目录 中 出 现 了 dpython.exe 文件 ， 没 有 任何 依赖 库 ， 执 行 它 

使 用 pyinstaller 库 需 要 注意 以 下 问题 。 

(1) 文件 路 径 中 不 能 出 现 空格 和 英文 句号 〈.)。 

(2) 源 文件 必须 是 UTF-8 编码 ， 暂 不 支持 其 他 编码 类 型 。 采 用 IDLE 编写 的 源 
文件 都 保存 为 UTF-8 编码 形式 ， 可 直接 使 用 。 


”动态 链接 并 供 了 二 种 方 法， 能 够 使 进程 在 运行 时 实际 调用 不 属于 鞠 程序 的 代 
! 码 。 如 果 其 他 代码 由 操作 系统 提供 ， 则 应 用 程序 由 于 不 包含 这 些 代码 而 变 得 十 分 ， 
' 精简 。Windows 平台 提供 大 量 的 动态 链接 库 ， 一 般 使 用 dll 或 ocx 为 扩展 名 。 |! 
， 静态 链接 与 动态 链接 相对 ， 指 程序 中 自 包含 其 所 调用 的 所 有 代码 ， 这 使 程序 ， 
: 可 以 在 系统 间 移 动 而 无 须 考虑 库 函 数 是 否 一 臻 . ， 


下 


8.4.2 pyinstaller 解析 


pyinstaller 有 一 些 常 用 参数 ， 如 表 8.1 所 示 。 


表 8.1 pyinstaller 命令 的 常用 参数 
参数 功 ”能 
-h, --help 查看 帮助 
-V, --Version 查看 pyinstaller 版 本 
--clean 清理 打包 过 程 中 的 临时 文件 
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续 表 
参数 功 能 
-D, --onedir 默认 值 ， 生 成 dist 目录 
-F, --onefile 在 dist 文件 夹 中 只 生成 独立 的 打包 文件 
-p DIR, --paths DIR 添加 Python 文件 使 用 的 第 三 方 库 路 径 
-1 <.ico or .exe,ID or .icns> 指定 打包 程序 使 用 的 图 标 (icon) 文件 


--icon <.lco or .exe,ID or .icns> 


pyinstaller 命令 不 需要 在 Python 源 文件 中 增加 代码 ， 只 需要 通过 命令 行进 行 打 
包 即 可 。-F 参数 最 为 常用 ， 对 于 包含 第 三 方 库 的 源 文件 ， 可 以 使 用 -p 添加 第 三 方 库 
所 在 路 径 。 如 果 第 三 方 库 由 pip 安装 且 在 Python 环境 目录 中 , 则 不 需要 使 用 -p 参数 。 
以 实例 10 的 实例 代码 9.3 为 例 ， 该 代码 使 用 了 jieba 库 ， 将 该 文件 改名 为 caltk.py， 
打包 方法 如 下 : 


在 dist 目录 中 将 生成 打包 文件 caltk.exe, 将 三 国 演义 .txt 文 件 复制 到 dist 目录 中 ， 
执行 该 程序 : 


思考 与 练习 
8.9 ”pyinstaller 命令 最 常 使 用 的 参数 有 哪些 ? 
8.10 如 果 Python 源 文件 使 用 了 第 三 方 库 ， 如 何 使 用 pyinstaller 命令 ? 
8.11 对 Python 源 文件 打包 有 哪些 优 缺 点 ? 


8.5 计算 生态 和 模块 编程 


要 点 ; Python 语言 有 9 万 多 个 第 三 方 库 ， 形 成 了 庞大 的 计算 生态 ， 请 读者 | 


1 
1 


‘Sea 


近 20 年 的 开源 运动 产生 了 深 植 于 各 信息 技术 领域 的 大 量 可 重用 资源 , 直接 且 有 
力 地 支撑 了 信息 技术 超越 其 他 技术 领域 的 发 展 速 度 ， 形 成 了 “计算 生态 ”。 产业 界 广 
泛 利 用 可 重用 资源 快速 构建 应 用 已 经 是 主流 产品 开发 方式 。Python 语言 从 诞生 之 初 
致力 于 开源 开放 ， 建 立 了 全 球 最 大 的 编程 计算 生态 。 

Python 官方 网 站 提供 了 第 三 方 库 索引 功能 (the Python Package Index，PyPT)， 
网 址 如 下 : 

https://pypi.python.org/pypi 
该 页 面 列 出 了 Python 语言 9 万 多 个 第 三 方 库 的 基本 信息 , 这 些 函 数 库 覆盖 信息 领域 
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技术 所 有 技术 方向 。 这 里 需要 说 明 的 是 ，Python 语言 的 函数 库 并 非 都 采用 Python 
语言 编写 。 由 于 Python 有 非常 简单 灵活 的 编程 方式 ， 很 多 采用 C、C++ 等 语言 编写 
的 专业 库 可 以 经 过 简单 的 接口 封装 供 Python 语言 程序 调用 。 这 样 的 黏 性 功能 使 得 
Python 语言 成 为 了 各 类 编程 语言 之 间 的 接口 ，Python 语言 也 被 称 为 “胶水 语言 ”。 

正 是 因为 Python 语言 有 了 胶水 的 黏 性 , 围绕 它 迅速 形成 了 全 球 最 大 的 编程 语言 
开放 社区 ， 建 立 了 9 万 多 个 第 三 方 库 的 庞大 规模 ， 构 建 了 计算 生态 。 

30 年 前 ,计算 机 领域 还 处 于 刀 耕 火种 年 代 ， 编写 程序 仅 能 调用 官方 提供 的 API 
功能 。20 年 前 ， 随 着 开源 运动 的 兴起 和 蓬勃 发 展 ， 一 批 开源 项 目 诞生 ， 降 低 了 专业 
人 士 编写 程序 的 难度 ， 实 现 了 专业 级 别 的 代码 复 用 。10 年 前 ， 开 源 运动 深入 开展 ， 
专业 人 士 开 始 大 量 贡 献 各 领域 最 优秀 的 研究 和 开发 成 果 ， 并 通过 开源 库 形 式 发 布 出 
来 。 那 今天 呢 ? 编程 领域 形成 了 庞大 的 计算 生态 ， 需 要 一 种 编程 语言 或 方式 将 不 同 
语言 、 不 同 特点 、 不 同 使 用 方式 的 代码 统一 起 来 。 历 史 选 择 了 Python 语言 ，Python 
语言 也 证 明了 它 的 价值 。 

Python 第 三 方程 序 包 括 库 (library)、 模 块 (module)、 类 (class) 和 程序 包 (Package) 
等 多 种 命名 ， 本 书 不 对 这 些 命名 进行 区 分 ， 统 一 将 这 些 可 重用 代码 统称 为 “ 库 ”。 
Python 内 置 的 库 称 为 标准 库 ， 其 他 库 称 为 第 三 方 库 。 

在 计算 生态 思想 指导 下 ， 编 写 程序 的 起 点 不 再 是 探究 每 个 具体 算法 的 逻辑 功能 
和 设计 ， 而 是 尽 可 能 利用 第 三 方 库 进行 代码 复 用 ， 探 究 运 用 库 的 系统 方法 。 这 种 像 
搭 积 木 一 样 的 编程 方式 ， 称 为 “模块 编程 ”。 每 个 模块 可 能 是 标准 库 、 第 三 方 库 、 用 
户 编写 的 其 他 程序 或 对 程序 运行 有 帮助 的 资源 等 。 模 块 编程 与 模块 化 设计 不 同 ， 模 
块 化 设计 主张 采用 自 顶 向 下 设计 思想 ， 主 要 开展 耦合 度 低 的 单一 程序 设计 与 开发 ， 
而 模块 编程 主张 利用 开源 代码 和 第 三 方 库 作 为 程序 的 部 分 或 全 部 模块 ， 像 搭 积 木 一 
样 编写 程序 。 

本 书 建立 在 “计算 生态 ”理念 基础 上 ， 试 图 通过 10 余 个 各 类 函数 库 和 20 余 个 
实例 讲解 让 读者 理解 并 学 会 运用 计算 生态 ， 编 写 功 能 更 强大 的 程序 。 

拓展 : Python 一 一 构建 计算 生态 的 编程 语言 
人 — TT 

一 一 你 将 走 进 信息 时 代 的 大 门 ， 能 够 运用 信息 时 代 的 最 新 成 果 。 

学 了 编程 能 做 什么 ? 似乎 只 能 打印 字符 、 挑 战 汉 诺 塔 。 这 是 大 多 数 编程 语言 
' 学 习 预 期 和 学 习 效果 的 渔 沟 。 因 为 绝 大 多 数 编程 语言 设计 用 于 开发 专业 功能 ， 而 
! 不 是 用 于 构建 计算 生态 ， 因 此 ， 需 要 专业 程序 员 经 过 漫长 学 习 才 能 够 掌握 并 开发 
! 有 价值 的 程序 。Python 语言 却 不 同 ， 它 不 是 其 他 语言 的 替代 ， 而 是 一 种 真正 面向 
! 计算 生态 的 语言 。 

! ”一 一 AlphaGo 很 粮 ， 它 打败 了 世界 上 最 厉害 的 人 类 围棋 选手 。 
| 一 一 AlphaGo 开源 了 ， 采 用 Python 语言 ， 快 去 试用 看 看 吧 。 
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思考 与 练习 
8.12 在 哪里 可 以 找到 Python 的 第 三 方 库 列表 ? 
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8.13 ”模块 编程 是 什么 含义 ? 
8.14 ”思考 实例 12 的 功能 ， 如 果 不 采用 第 三 方 库 ， 需要 学 习 哪些 专业 知识 才能 
写 出 程序 ? 


8.6 Python 第 三 方 库 的 安装 


i mm 


> > oe 
(1 We 0 A a 
i et 上 Es le 
类 Y Ws 3 不 
eb 3 高 < 
-—-—------—- 一 一- 2 一 


Python 语言 有 标准 库 和 第 三 方 库 两 类 库 ， 标准 库 随 Python 安装 包 一 起 发 布 ， 用 ， 
户 可 以 随时 使 用 ， 第 三 方 库 需 要 安装 后 才能 使 用 。 由 于 Python 语言 经 历 了 版 本 更 返 
过 程 , 而 且 , 第 三 方 库 由 全 球 开 发 者 分 布 式 维护 , 缺少 统一 的 集中 管理 , 因此 , Python 
的 第 三 方 库 曾 经 一 度 制约 了 Python 语言 的 普及 和 发 展 。 随 着 官方 pip 工具 的 应 用 ， 
Python 第 三 方 库 的 安装 变 得 十 分 容易 。 

Python 第 三 方 库 依 照 安装 方式 灵活 性 和 难 易 程 度 有 3 个 安装 方法 ， 建 议 读者 依 
次 使 用 ， 能 够 将 第 三 方 库 安装 成 功 ， 这 3 个 方法 是 pip 工具 安装 、 自 定义 安装 和 文 
件 安 装 。 


8.6.1 pip 工具 安装 


PE 


最 常用 且 最 高 效 的 Python 第 三 方 库 安装 方式 是 采用 pip 工具 安装 。pip 是 Python 
官方 提供 并 维护 的 在 线 第 三 方 库 安装 工具 。 对 于 同时 安装 Python 2 和 Python 3 环境 
的 系统 ， 建 议 采 用 pip3 命令 专门 为 Python 3 版 本 安装 第 三 方 库 。 为 了 叙述 方便 ， 本 
文 后 续 都 采用 pip 代替 pip 或 pip3 命令 。 

pip 是 Python 内 置 命令 ， 需 要 通过 命令 行 执 行 ， 执 行 pip -h 命令 将 列 出 pip 常 
用 的 子 命令 ， 注 意 ， 不 要 在 IDLE 环境 下 运行 pip 程序 。 
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pip 支持 安装 〈install)、 下 载 (download)、 外 载 (uninstall)、 列 表 (list)、 查 
看 〈show)、 查 找 〈search) 等 一 系列 安装 和 维护 子 命令 。 

安装 一 个 库 的 命令 格式 如 下 : 

pip install < 拟 安装 库 名 > 

例如 ， 安 装 pygame 库 ，pip 工具 默认 从 网 络 上 下 载 pygame 库 安 装 文件 并 自动 
安装 到 系统 中 。 


使 用 -U 标签 可 以 更 新 已 安装 库 的 版 本 ， 例 如 ， 用 pip 更 新 本 身 : 


和 卸载 一 个 库 的 命令 格式 如 下 : 
pip uninstall < 拟 卸 载 库 名 > 
例如 ， 印 载 pygame 库 ， 印 载 过 程 可 能 需要 用 户 确 认 。 


可 以 通过 list 子 命令 列 出 当前 系统 中 已 经 安装 的 第 三 方 库 ， 例 如 : 
pip. 1ist 


执行 效果 如 下 ， 部 分 结果 省 略 : 


pip 的 show 子 命令 列 出 某 个 已 经 安装 库 的 详细 信息 ， 例 如 ; 
pip show < 拟 查询 库 名 > 
以 sip 库 为 例 ， 执 行 效果 如 下 : 
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pip 的 download 子 命令 可 以 下 载 第 三 方 库 的 安装 包 ， 但 并 不 安装 ， 例 如 : 
pip download < 拟 下 载 库 名 > 
以 下 载 PyQt5 为 例 ， 执 行 效 果 如 下 : 


pip 的 search 子 命令 可 以 联网 搜索 库 名 或 摘要 中 的 关键 字 ， 例 如 : 
pip search < 拟 查询 关键 字 > 
以 查询 installer 为 例 ， 执 行 效果 如 下 : 


pip 是 Python 第 三 方 库 最 主要 的 安装 方式 , 可 以 安装 超过 90% 以 上 的 第 三 方 库 。 
然而 ， 由 于 一 些 历史 、 技 术 和 政策 等 原因 ， 还 有 一 些 第 三 方 库 暂 时 无 法 用 pip 安装 ， 
此 时 ， 需 要 其 他 的 安装 方法 。 

pip 工具 与 操作 系统 也 有 关系 ， 在 Mac OS X 和 Linux 等 操作 系统 中 ，pip 工具 
几乎 可 以 安装 任何 Python 第 三 方 库 ， 在 Windows 操作 系统 中 ， 有 一 些 第 三 方 库 仍 
然 需 要 用 其 他 方式 尝试 安装 。 
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8.6.2” 自 定义 安装 


自 定义 安装 指 按照 第 三 方 库 提 供 的 步骤 和 方式 安装 。 第 三 方 库 都 有 主页 用 于 维 
护 库 的 代码 和 文档 。 以 科学 计算 用 的 numpy 为 例 ， 开 发 者 维护 的 官方 主页 如 下 : 
http://www.numpy.org/ 
浏览 该 网 页 找到 下 载 链 接 ， 如 下 : 
http://www.scipy.org/scipylib/download.html 
自 定 义 安装 一 般 适 合用 于 pip 中 尚 无 登记 或 安装 失败 的 第 三 方 库 。 


8.6.3 文件 安装 


由 于 Python 某 些 第 三 方 库 仅 提供 源 代码 ,通过 pip 下 载 文件 后 无 法 在 Windows 
系统 编译 安装 ， 会 导致 第 三 方 库 安装 失败 。 在 Windows 平台 下 所 遇 到 的 无 法 安装 第 
三 方 库 的 问题 大 多 属于 这 类 。 

为 了 解决 这 类 第 三 方 库 安装 问题 ， 美 国 加 州 大 学 尔 湾 分 校 提 供 了 一 个 页 面 ， 帮 
助 Python 用 户 获得 Windows 可 直接 安装 的 第 三 方 库 文件 ， 链 接地 址 如 下 : 

http://www.lfd.uci.edu/~gohlke/pythonlibs/。 

该 地 址 列 出 了 一 批 在 pip 安装 中 可 能 出 现 问 题 的 第 三 方 库 。 这 里 以 scipy 为 例 说 明 ， 
首先 在 上 述 页 面 中 找到 scipy 库 对 应 的 内 容 ， 如 图 8.4 所 示 。 
SciPy is software for mathematics, science, and engineering, 


Requires numpy+tmkl. 
Install mumpy+mkl before installing scipy. 


scipy-0. 18. 1-cp27-cp27m-win32. whl 
scipy-0. 18. 1-cp27-cp27m-win amd64. whl 
scipy-0. 18. l-cp34-cp3dm-win32. whl 
scipy-0. 18. 1-cp34-cp3dm-win amd64. whl 
scipy-0. 18. 1-cp35-cp35m-win32. whl 
scipy-0. 18. 1-cp35-cp35m-win amd64. whl 


图 8.4 scipy 库 对 应 的 Windows 文件 下 载 页 面 


选择 其 中 的 .whl 文件 下 载 , 这 里 选择 适用 于 Python 3.5 版 本 解释 器 和 32 位 系统 
的 对 应 文件 :scipy-0.18.1-cp35-cp35m-win32.whl， 下 载 该 文件 到 D:\pycodes 目录 。 
然后 ， 采 用 pip 命令 安装 该 文件 。 
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a 


| 的 安装 包 文件 。whl 文件 本 质 上 是 一 个 压缩 格式 文件 ， 可 以 通过 改 扩展 名 为 zip ; 
' 查看 其 中 内 容 。whl 格式 用 于 替代 Python 早期 的 eggs 格式 ， 是 Python 打包 格式 ， 


se- 


对 于 上 述 3 种 安装 方式 ， 一 般 优先 选择 采用 pip 工具 安装 ， 如 果 安 装 失败 ， 则 
选择 自 定义 安装 或 者 文件 安装 (Windows 平台 )。 另 外 ， 如 果 需 要 在 没有 网 络 条 件 
下 安装 Python 第 三 方 库 ， 请 直接 采用 文件 安装 方式 。 其 中 ，.whl 文件 可 以 通过 pip 
download 指令 在 有 网 络 条 件 的 情况 下 获得 。 


思考 与 练习 
8.15 pip 工具 最 常用 的 子 命令 是 什么 ? 
8.16 如 果 pip 工具 无 法 安装 第 三 方 库 ， 还 有 哪些 其 他 办 法 ? 
8.17 ”下载 一 些 Python 第 三 方 库 文件 (.whl 文件 )， 尝 试 通过 文件 方式 安装 。 


8.7 ”实例 16: pip 安装 脚本 


了 


Python 安装 包 自 带 工 具 pip (或 pip3) 是 安装 第 三 方 库 最 重要 的 方法 。pip 的 使 
用 十 分 方便 ， 本 节 介 绍 一 些 重要 的 第 三 方 库 ， 同 时 请 读者 用 pip 安装 这 些 函数 库 。 

实例 16 共 需 要 安装 20 个 第 三 方 Python 库 ， 如 表 8.2 所 示 ， 需 要 注意 的 是 ， 库 
名 是 第 三 方 库 常 用 的 名 字 ，pip 安装 用 的 名 字 和 库 名 不 一 定 完全 相同 ， 建 议 采 用 小 
写字 符 。 


表 8.2 第 三 方 Python 库 ( 共 20 个 ) 


库 。 名 pip 安装 指令 
Numpy pip install numpy 
Matplotlib 产品 级 2D 图 形 绘制 pip install matplotlib 
PIL 图 像 处 理 pip install pillow 
sklearn pip install sklearn 
Requests HTTP 协议 访问 pip install requests 
Jieba pip install jieba 
Beautiful Soup 或 bs4 pip install beautifulsoup4 
Wheel pip install wheel 
pyinstaller pip install pyinstaller 
Django pip install django 


Flask 轻 量 级 Web 开发 框架 pip install flask 
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库 名 pip 安装 指令 


pip install werobot 
pip install networkx 
pip install sympy 
pip install pandas 


pip install pyqt$ 


pip install pyopengl 


WeRoBot 微 信 机 器 人 开发 框架 

Networkx 复杂 网 络 和 图 结构 的 建 模 和 分 析 
SymPy 数学 符号 计算 

pandas 高 效 数据 分 析 

PyQt5 基于 Qt 的 专业 级 GUI 开发 框架 
PyOpenGL 多 平台 OpenGL 开发 接口 
PyPDF2 PDF 文件 内 容 提 取 及 处 理 
docopt Python 命令 行 解析 


PyGame 简单 小 游戏 开发 框架 


安装 过 程 请 在 系统 命令 行 下 进行 ， 而 不 要 在 IDLE 中 ， 部 分 库 会 依赖 其 他 函数 


pip install pypdf2 
pip install docopt 
pip install pygame 


库 ，pip 会 自动 安装 ， 部 分 库 下 载 后 需要 一 个 安装 过 程 ，pip 也 会 自动 执行 。 成 功 安 
装 库 后 会 出 现 “Successfully installed… ”提示 ， 效 果 如 下 : 


:\>pip install pygame 


Installing collected packages: pygame 
Successfully installed pygame-1.9.2b1 


如 果 读 者 希望 自动 安装 这 些 库 , 可 以 使 用 Python 标准 库 os 的 system() 函 数 调 用 
控制 台 。 实 例 代码 16.1 给 出 了 采用 pip 批量 安装 Python 库 的 方法 。 


实例 代码 16.1 e16.1BatchInstall.py 


‘ 
0 
' 
上 
' 
上 
U 


二 


1 | #el6.lBatchInstall.py 
2 | import os 


3 libs = {"numpy","matplotlib","pillow","sklearn", "requests",\ 


Gry 
for 1ib dn 11ibs: 
os.system("pip install "+1Lib) 
Print("Successful") 
except: 


DDN WwW 少 


Print("Failed Somehow") 


邱 展 ;” PyPI 的 权重 值 


"jieba","beautifulsoup4","wheel","networkx","sympy",\ 
"Pyinstaller","django","flask","werobot","PyQt5",\ 
"pandas" 2 "pyopengl 村 和 "pypdf2 和 "docopt" 和 "pygame" } 


下 载 的 情况 计算 了 权重 值 ( Weight)。 由 于 第 三 方 库 的 开发 没有 任何 规划 ,对 于 菜 
个 功能 将 有 一 批 库 可 以 支持 ， 权 重 值 较 高 的 库 往 往 质量 更 好 。 


a 
) 


Cr 


源 代码 8=-2: 


方 库 批 量 安 


236 第 三 部 分 运用 Python 语言 


思考 与 练习 
8.18 ”什么 情况 下 使 用 pip3 指令 安装 第 三 方 库 ? 
8.19 ”os.system() 函 数 的 功能 是 什么 ? 
8.20 ”请 读者 调研 选取 一 个 最 感 兴趣 的 第 三 方 库 ， 并 将 它 安装 在 系统 中 。 


本 章 前 述 了 计算 思维 的 概念 ， 以 体育 竞技 分 析 为 例 介绍 了 上 自 项 向 下 的 设计 方法 
和 自 底 向 上 的 测试 方法 。 进一步 图 述 了 利用 Python 第 三 方 库 编程 的 模块 编程 思想 和 
计算 生态 的 理解 和 运用 。 


程序 练习 是 


8.1 借鉴 实例 15 的 思路 ， 采 用 乒乓 球 规则 模拟 比赛 ， 分 析 体 育 竞 技 规律 。 

8.2 ”借鉴 实例 15 的 思路 ， 采 用 篮球 规则 模拟 比赛 ， 分 析 体育 竞技 规律 。 比 较 
结果 与 程序 练习 题 8.1 的 不 同 。 

8.3 ”You-Get 是 一 个 基于 Python 3 的 视频 下 载 工具 ， 支 持 多 数 国 内 外 主流 视频 
站 点 的 视频 下 载 。 请 查找 该 项 目的 主页 ， 安 装 这 个 第 三 方 库 并 编写 一 个 实例 。 

8.4 词 云 是 设计 和 统计 的 结合 ， 也 是 艺术 与 计算 机 科学 的 碰撞 。Wordcloud 是 
一 款 基于 Python 的 词 云 第 三 方 库 ， 支 持 对 词语 数量 、 背 景 蒙 版 、 字 体 颜色 等 各 种 细 
节 的 设置 ， 试 结合 jieba 的 分 词 功 能 构建 《三 国 演 义 》 的 词 云 效果 。 
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矿 瀑 不 厚 光 严 六 贷 ， 沁 与 和 六 作 你 棉 庆 。 
Computing is not about computers any more. lt is about living. 
一 一 尼古拉斯 。 尼 葛 洛 庞 斋 (Nicholas Negroponte) 
麻 省 理工 学 院 媒体 实验 室 的 创办 人 


©@ eseaapeeeessees 和 
学 习 目标 ; 


(1) 了 解 科学 计算 的 基本 概念 。 

(2) 了 解数 据 可 视 化 的 概念 。 

(3) 运用 科学 计算 库 进行 矩阵 分 析 和 数值 运算 。 
: (4) 了 解 图 像 的 矩阵 表示 和 处 理 。 
(5) 运用 数据 绘图 库 进 行 坐标 系 绘制 。 
: (6) 运用 数据 绘图 库 进行 雷达 图 绘制 。 ; 


照片 照 得 好 ,不 如 滤 镜 用 得 好 ! 一 款 好 的 滤 镜 软件 可 以 让 照片 呈现 不 一 样 的 风格 
万 至 风情 ， 修 理 照 片 需要 扬长 避 短 达到 最 佳 效果 。 可 是 滤 镜 款式 千 百 种 ， 却 没有 一 
款 专门 为 你 设计 ? 不 如 自己 来 写 个 滤 镜 吧 。 

本 章 将 以 PIL 库 和 numpy 库 为 基础 零 起 点 编写 一 款 手绘 风 的 高 逼 格 滤 镜 。 
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人 类 认识 世界 遵循 由 表 及 里 、 由 定性 到 定量 、 由 数据 到 规律 的 过 程 。 无 论 是 说 
明 事物 属性 、 展 示 数 据 规律 、 阅 述 规 律 原理 ,还 是 论述 观点 、 支 持 决策 、 预 测 分 析 ， 
都 离 不 开 基 于 数学 和 运算 的 科学 表达 ， 这 需要 科学 计算 的 支持 。 科 学 计算 是 为 了 解 
决 科学 和 工程 中 数学 问题 而 利用 计算 机 进行 的 数值 计算 ， 它 不 仅 是 科学 家 在 运算 自 
然 规律 时 所 采用 的 方法 ， 更 是 普通 人 提升 专业 化 程度 的 必要 手段 。Python 语言 为 开 
展 人 人 都 能 使 用 的 科学 计算 提供 了 有 力 支 持 。 

开展 基本 的 科学 计算 需要 两 个 步骤 : 组 织 数 据 和 展示 数据 。 组 织 数 据 是 运算 的 
基础 ， 也 是 将 客观 世界 数字 化 的 必要 手段 ， 展 示 数 据 是 体现 运算 结果 的 重要 方式 ， 
也 是 展示 结论 的 有 力 武 器 。 本章 将 分 别 介绍 用 于 组 织 和 运算 数据 的 第 三 方 Python 库 
numpy 机 会 制 专业 图 表 的 第 三 方 库 matplotlib 。 
怎么 说 ， 科 学 计算 都 是 科学 家 该 做 的 事 ， 与 普通 人 无 关 。 

和 不 烛 用 程 凤 中 县 敢 片 的 手续 效 归 2 

请 读者 快速 浏览 9.3 节 、9.5 节 和 9.6 节 ， 这 些 实例 说 明 ， 科 学 计算 不 仅 能 够 展 
示 数 字 结 果 ， 还 能 够 与 PIL 图 像 库 混合 使 用 产生 有 趣 的 手绘 效果 ， 更 能 够 让 数据 展 
示 变 得 非常 专业 。 掌 握 这些 能 力 ， 仅 需要 了 解 Python 的 两 个 第 三 方 库 。 

先 补充 一 个 简单 的 数学 概念 一 一 矩阵 。 数 学 的 矩阵 〈Matrix) 是 一 个 按照 长 方 
阵列 排列 的 复数 或 实数 集合 ， 最 早 来 自 于 方程 组 的 系数 及 常数 所 构成 的 方 阵 。 和 矩阵 
是 高 等 代数 学 中 的 常见 工具 ， 主 要 应 用 于 统计 数学 、 物 理学 、 电 路 学 、 力 学 、 光 学 、 
量子 物理 、 计 算 机 图 像 和 动画 等 领域 。 

传统 的 科学 计算 主要 基于 算 阵 运算 ， 因 为 大 量 数值 通过 和 矩阵 可 以 有 效 组 织 和 表 
达 。 科 学 计算 领域 最 著名 的 计算 平台 Matlab 采用 和 矩阵 作为 最 基础 的 变量 类 型 。 矩阵 
有 维度 概念 ， 一 维和 矩阵 是 线性 的 ， 类 似 于 列表 ， 二 维和 矩阵 是 表格 状 的 ， 这 是 常用 的 
数据 表示 形式 。 科 学 计算 与 传统 计算 的 一 个 显著 区 别 在 于 ， 科 学 计算 以 矩阵 而 不 是 
第 一 笋 全 为 基础 。 增 加 了 计算 密度 ， 能 够 表达 更 为 复杂 的 数据 运算 汉 将 。 

展 ， 离散 和 连续 


‘ 关联 是 一 不 虹 邓 的 高 让 实 章 类 型， 它 将 一 些 玫 所 组 识 到 二 起， 世界 是 连续 的 ， 
; 还 是 离散 的 呢 ? 从 人 类 观测 角度 ， 世 界 可 以 被 解释 成 一 个 个 离散 的 观测 值 ; 从 微 ; 
' 观 角度 ， 世 界 是 原子 不 停 运 动 的 结果 ， 应 该 是 连续 的 ; 再 微观 到 量子 力学 角度 ， 任 何 
' 连续 运动 都 是 最 小 粒子 量子 运动 的 结果 ，, 世界 应 该 是 离散 的 。 宇宙 真有 最 小 粒子 吗 ? 
! ”一 一 世界 是 不 确定 的 ， 还 是 确定 的 ?世界 是 娄 率 的 ， 还 是 微 积 分 的 ? 

! ”一 醒 醒 ， 开 始 看 程序 ! 


和 
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思考 与 练习 
9.1 请 思考 在 日 常 工作 和 生活 中 科学 计算 还 有 什么 应 用 。 
9.2 ”请 尝试 安装 numpy 和 matplotlib 库 。 


9.2 模块 8: numpy 库 的 使 用 


0 


numpy 是 用 于 处 理 含有 同 种 元 素 的 多 维 数组 运算 的 第 三 方 库 。 


NS 二- 一 一 一 一 一 一 一 一 一 一 ~~ 一 一 ~ 一 一 二 一 一 一 一 二 一 一 一 一 = 一 = 一 一 


9.2.1 numpy 库 概 述 


Python 标准 库 中 提供 了 一 个 array 类 型 ， 用 于 保存 数组 类 型 数据 ， 然 而 这 个 类 图 片 资 料 9-1 
型 不 支持 多 维 数据 ， 处 理 函 数 也 不 够 丰富 ， 不 适合 数值 运算 。 因 此 ，Python 语言 的 。 Python 估 束 低 考 


之 numpy 库 


第 三 方 库 numpy 得 到 了 迅速 发 展 ， 至 今 ，numpy 已 经 成 为 了 科学 计算 事实 上 的 标 
准 库 。 

numpy 库 处 理 的 最 基础 数据 类 型 是 由 同 种 元 素 构 成 的 多 维 数组 (ndarray)， 简 
称 “ 数 组 ”。 数 组 中 所 有 元 素 的 类 型 必须 相同 ， 数 组 中 元 素 可 以 用 整数 索引 ， 序 号 从 
0 开始 。ndarray 类 型 的 维度 (dimensions) 叫做 轴 《〈axes)， 轴 的 个 数 叫 做 秩 (rank)。 
一 维 数组 的 秩 为 1， 二 维 数组 的 秩 为 2， 二 维 数 组 相当 于 由 两 个 一 维 数组 构成 。 

由 于 numpy 库 中 函数 较 多 且 命 名 容易 与 常用 命名 混淆 , 建议 采用 如 下 方式 引用 
numpy 库 : 


其 中 ，as 保留 字 与 import 一 起 使 用 能 够 改变 后 续 代码 中 库 的 命名 空间 ， 有 助 于 提高 
代码 可 读 性 。 简 单 地 说 ， 在 程序 的 后 续 部 分 中 ，np 代替 numpy。 


9.2.2 numpy 库 解 析 


numpy 库 和 常用 的 创建 数组 (ndarray 类 型 ) 函数 共有 7 个 ， 如 表 9.1 所 示 。 
表 9.1 umpy 库 常用 的 数组 创建 函数 ( 共 7 个 ) 


J 拘 站 和 述 
np.array([x,y,Z], dtype=int) 从 Python 列表 和 元 组 创造 数组 
np.arange(x,y,i) 创建 一 个 由 x 到 y， 以 i 为 步 长 的 数组 
np.linspace(x,y,n) 创建 一 个 由 x 到 y， 等 分 成 n 个 元 素 的 数组 
np.indices((m,n)) 创建 一 个 m 行 n 列 的 矩阵 


np.random.rand(m,n) 创建 一 个 m 行 n 列 的 随机 数组 
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创建 一 个 简单 的 数组 后 ， 可 以 查看 ndarray 类 的 基本 属性 ， 如 表 9.2 所 示 。 
表 9.2 ke edd de C7 个 > 


CE 一 一 1 和 本 2 > 


属 性 -<7TE?HN > 为 Se ; 述 i 加 
ndarray.ndim 数组 轴 的 个 数 ， 也 被 称 作 析 
ndarray.shape 数组 在 每 个 维度 上 大 小 的 整数 元 组 
ndarray.size 数组 元 素 的 总 个 数 
ndarray.dtype 数组 元 素 的 数据 类 型 ，dtype 类 型 可 以 用 于 创建 数组 
ndarray.itemsize 数组 中 每 个 元 素 的 字 节 大 小 
ndarray.data 包含 实际 数组 元 素 的 缓冲 区 地 址 
ndarray.flat 数组 元 素 的 迭代 器 
使 用 实例 如 下 : 


数组 在 numpy 中 被 当 作 对 象 ， 可 以 采用 <a>.<b>() 方 式 调用 一 些 方法 。 表 9.3 给 
出 了 改变 数组 基础 形态 的 操作 方法 , 例如 改变 和 调换 数组 维度 等 。 其 中 , np.flatten() 
函数 用 于 数组 降 维 ， 相 当 于 平 铺 数组 中 的 数据 ， 该 功能 在 矩阵 运算 及 图 像 处 理 中 用 
处 很 大 。 
表 9. 3 ndarray 类 的 形态 操作 方法 GS 5 个 》 
i 


ndarray.reshape(num) ET 
ndarray.resize(new_shape) 与 reshape() 作 用 相同 ， 直 接 修改 数组 ndarray 


ndarray.swapaxes(ax1, ax2) 将 数组 n 个 维度 中 任意 两 个 维度 进行 调换 
ndarray. flatten() 对 数组 进行 降 维 ， 返 回 一 个 折 邯 后 的 一 维 数组 
ndarray.ravel() 作用 同 np.flatten0， 但 是 返回 数组 的 一 个 视图 
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表 9.4 给 出 了 ndarray 类 的 索引 和 切片 方法 。 数 组 切片 得 到 的 是 原始 数组 的 视图 ， 
所 有 修改 都 会 直接 反映 到 源 数组 。 如 果 需 要 得 到 ndarray 切片 的 一 份 副本 ， 和 需要 进 
行 复 制 操作 ， 比 如 arange[5:8].copy(。 


表 9.4 ndarray 类 的 索引 和 切片 方法 ( 共 5 个 ) 


索引 第 i 个 元 素 
从 后 向 前 索引 第 i 个 元 素 


x[i] 
X[- 可 


x[n:m] 默认 步 长 为 1， 从 前 往 后 索引 ， 不 包含 以 
x[=m:-n] 默认 步 长 为 1， 从 后 往 前 索引 ， 结 束 位 置 为 


指定 i 步 长 的 由 到 m 的 索引 


x[7,1,7] 


使 用 实例 如 下 : 


>>>a = np.random.rand(5,3) # 生 成 5x3 的 数组 ， 用 随机 数 填充 
>>>a[2] # 获 得 第 2 行 数 据 
artayf([ 0.78426574, 0.60171943, 0.98825306]) 
>>>a[1L:3] 本 
array([[ 0,.49276756, 0.44735929， LO0SS677I3] 

[ 0.78426574, 0.60171943, 0.98825306]]) 
>>>al[l-5:-2:2] 
array(lt O095517757 O3634953 7 0 34138831]A 
[ 0.78426574,; ‘0.60171943, 0.98825306]]) 


除了 ndarray 类 型 方法 外 , numpy 库 提 供 了 一 批 运算 函数 。 表 9.5 列 出 了 numpy 
” 库 的 算术 运算 函数 ， 共 8 个 。 这 些 函数 中 ， a y 可 选 ， 如 果 没 有 指定 ， 将 创 
建 并 返回 一 个 新 的 数组 保存 计算 结果 ; 如 果 指 定 参 数 ， 则 将 结果 保存 到 参数 中 。 例 
如 ， 两 个 数组 相 加 可 以 简单 地 写 为 atb， 而 np. b,a) 则 表示 a+=b。 


和 


函数 炳 | “ 沈 十 
np.add(x1, x2 [, y]) 三 广 ] 十 六 和 2 
np.subtract(x1, x2 [, y]) y=Xxl]—x2 
np.multiply(x1, x2 [, y]) y 三 天 名 
np.divide(x1, x2 [, y]) y=X1 /x2 
np floor divide(x1, x2 [, y]) y=Xxl W/x2， 返 回 值 取 整 
np.negative(x [,y]) y=—xX 
np.power(x1, x2 [, y]) y=X1**X2 
np.remainder(x1, x2 [, y]) y= xXx] % x2 


表 9.6 列 出 了 numpy 库 的 比较 运算 函数 ， 共 7 个 。 
表 9.6 numpy 库 的 比较 运算 函数 〈 共 7 个 ) 


np. equal(x1, x2 [, y]) 
np. not equal(x1, x2 [, y]) y=Xl] l=x2 
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函 ” 数 符号 描述 
np. less(x1, x2. [, y]) y=xl <x2 
np. less_equal(x1, x2, [, y]) y=xl] <=x2 
np. greater(x1, x2, [, y]) y=X1l>x2 
np. greater equal(x1, x2, [, y]) y=xX] >=x2 
np.where(condition[x,y]) 根据 给 出 的 条 件 判断 输出 x 还 是 y 


表 9.6 将 返回 一 个 布尔 数组 ， 它 包含 两 个 数组 中 对 应 元 素 值 的 比较 结果 ， 例 子 
如 下 。where() 函 数 是 三 元 表达 式 x if condition elsey 的 矢量 版 本 。 


>>>np.less([1,2],[2,2]) 
array([ True, False], dtype=br 


numpy 还 有 其 他 一 些 有 趣 而 操作 方便 的 函数 ， 如 表 9.7 所 示 。 
表 9.7 numpy 库 的 其 他 运算 函数 〈 共 9 个 ) 


1 i 0 


函 数 “' 吓 述 
np.abs(x) 计算 基于 元 素 的 整 型 、 浮 点 或 复数 的 绝对 值 
np.sqrt(X) 计算 每 个 元 素 的 平方 根 
np.squre(x) 计算 每 个 元 素 的 平方 
np.sign(x) 计算 每 个 元 素 的 符号 : 1(+)、0、-1(-) 
np.ceil(x) 计算 大 于 或 等 于 每 个 元 素 的 最 小 值 
np.floor(x) 计算 小 于 或 等 于 每 个 元 素 的 最 大 值 
np.rint (x[, out]) 圆 整 ， 取 每 个 元 素 为 最 近 的 整数 ， 保 留 数据 类 型 
np:exp(x[, out]) 计算 每 个 元 素 的 指数 值 
np.log(x), np.log10(x), np.log2(x) 计算 自然 对 数 (e)， 基 于 10、2 的 对 数 ，log(1 + x) 


numpy 库 还 包括 三 角 运算 函数 、 傅 里 叶 变 换 、 随 机 和 概率 分 布 、 基 本 数值 统计 、 
位 运算 、 和 矩阵 运算 等 非常 丰富 的 功能 ， 读 者 在 使 用 时 可 以 到 官方 网 站 查询 。 


纪 珊 国运 算 规则 


下 人 人 站 站 了 站 下 大 一 辣 天 二 站 天 全 亲王 一 亲信 三 汪 一 站 六 一 一 工 一 一 一 一 一 一 一 一 一 一 一 一 一 一 mmmeennnmerrmnem 


' 实数 的 工 术 运算 是 最 为 常见 的 运算 规则 ， 类 似 的 ， 矩 阵 也 有 算术 运算 。 一 个 ， 
完备 的 运算 体系 包括 运算 基本 单位 和 运算 规则 。 在 numpy 中 ,运算 基本 单位 是 数 ) 
! 组 ， 运 算 规则 与 实数 一 样 ， 包 括 算术 运算 、 比 较 运 算 、 统 计 运 算 、 三 角 运算 、 随 ! 


机 运算 等 。numpy 库 的 广泛 使 用 与 完备 的 运算 体系 密切 相关 。 


* 


== 0 >=0005 


思考 与 练习 
9.3 创建 一 个 ndarray 变量 有 哪些 方法 ? 
9.4 ”如 何 对 ndarray 的 每 个 变量 求 平方 根 ? 
9.5 思考 ndarray 的 降 维 是 什么 含义 。 
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9.3 实例 17: 图 像 的 手绘 效果 


一 一 
~ 


7.2 节 使 用 PIL - 库 获取 了 图 像 的 轮廓 ， 虽然 提取 了 轮 志 ， 但 这 个 轮 亡 铀 少 立体 
感 ， 视 觉 效 果 不 够 丰满 。 光 线 照射 使 立体 物 出 现 明暗 变化 ， 运 用 这 个 原理 是 空间 素 
描 的 基本 方法 ,本 节 介 绍 采 用 Python 程序 增加 深浅 层次 变化 ， 从 而 使 图 像 轮廓 更 富 
立体 感 、 空 间 感 和 色泽 感 ， 接 近 人 类 手绘 效果 。 


9.3.1 图 像 的 数组 表示 


图 像 是 有 规则 的 二 维 数据 ， 可 以 用 numpy 库 将 图 像 转换 成 数组 对 象 ， 以 北京 故 
宫 的 照片 为 例 ， 名 称 为 fcityjpg， 放 置 在 D:\pycodes 目录 下 ， 方 法 如 下 : 


图 像 转 换 对 应 的 ndarray 类 型 是 三 维 数据 ， 如 (881, 1266, 3)， 其 中 ， 前 两 维 表示 
图 像 的 长 度 和 宽度 ， 单 位 是 像素 ， 第 三 维 表示 每 个 像素 点 的 RGB 值 ， 每 个 RGB 值 
是 一 个 单字 节 整 数 。 

PIL 库 包 括 图 像 转 换 函 数 ， 能 够 改变 图 像 单个 像素 的 表示 形式 。 使 用 convert() 
函数 ， 这 是 蕊 模式， 表示 将 像素 从 RGB 的 3 字 节 形式 转变 为 单一 数值 形式 ， 这 个 
数值 范围 为 0 一 255, 表示 灰 度 色彩 变化 。 此 时 , 图像 从 彩色 变 为 带 有 灰 度 的 黑白 色 。 
转换 后 ， 图 像 的 ndarray 类 型 变 为 二 维 数据 ， 每 个 像素 点 色彩 只 由 一 个 整数 表示 。 


通过 对 图 像 的 数组 转换 ， 可 以 利用 numpy 访问 图 像 上 的 任意 像素 值 ， 例 如 ， 获 
取 位 于 坐标 (20，300) 像 素 的 颜色 值 或 获取 图 像 中 最 大 和 最 小 的 像素 值 。 也 可 以 采用 
切片 方式 获取 指定 行 或 列 的 元 素 值 ， 甚 至 修改 这 些 值 。 
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日 85 
>>>print (im[10,:]) 
[lg HS Ee, vA ol 


将 图 像 读 入 ndarray 数组 对 象 后 ， 可 以 通过 任意 数学 操作 来 获取 相应 的 图 像 变 
换 。 以 灰 度 变换 为 例 ， 分 别 对 灰 度 变化 后 的 图 像 进行 反 变 换 、 区 间 变 化 和 像素 值 平 
方 处 理 。 需 要 注意 的 是 ， 有 些 数学 变换 会 改变 图 像 的 数据 类 型 ,如 变 成 整数 类 型 等 ， 
所 以 在 重新 生成 PIL 图 像 前 要 先 将 数据 类 型 通过 numpy.uint() 变 换 成 整数 ， 实 例如 
下 。 像 素 处 理 后 产生 的 图 像 如 图 9.1 所 示 。 


| >>>im0 = np.array (Image.open('np.jpg') .convert('L')) 
>>>iml = 255 - im0 # 反 变换 

>>>im2 (100/255)*im0 + 150 # 区 间 变 换 

>>>im3 = 255*(iml/255)**2 # 像 素平 方 处 理 


>>>pil im = Image.fromarray (np.uint (iml)) # 分 别 对 iml、im2、im3 执行 
Ds >>>pil im.show() 


ey 


| Iss 
(a) 原 图 像 (b) 对 iml 执行 


. (9 对 inm2 执行 的 结果 (d) 对 im3 执行 的 结果 


图 9.1 像素 处 理 后 产生 的 图 像 


丘 展 大 度 值 


mm Pr 一 mw 


; 因此 ， 黑 白 图 像 也 被 称 为 灰 度 图 像 、 黑白 图 像 主 要 用 于 构建 非 可 见 光 图 像 ， 例 如 
; 医学 中 超声 波形 成 的 图 像 等 。RGB 彩色 图 片 可 以 通过 如 下 公式 转换 成 灰 度 值 : 


oS 0 do 


Ce 


* 
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Gray=Rx0.3+Gx0.59+Bx0.11 
! 严格 地 说 ， 黑 白 图 像 是 计算 机 计算 能 力 或 存储 能 力 不 充分 时 形成 图 像 的 重要 


》 
1 
i 
4 
1 
U 
1 
4 
U 
' 
} 

SE 7 


9.3.2 ”图 像 的 手绘 效果 


7.2 节 介 绍 了 10 种 ImageFilter 类 型 的 滤 镜 方法 。 获 得 铅笔 画 风 格 图 像 通常 采用 
ImageFilter.CONTOUR 滤 镜 ， 它 能 够 将 图 像 的 轮廓 信息 提取 出 来 ， 如 图 9.2 (a) 所 
示 。 原 图 像 在 视觉 上 更 加 立体 ， 获 得 的 轮廓 图 像 缺 乏 立 体感 。 图 9.2 (b) 给 出 了 和 希 
望 由 程序 给 出 的 手绘 效果 。 这 个 效果 用 7.2 节 10 种 滤 镜 都 无 法 实现 ， 该 怎么 用 程序 
实现 呢 ? 


ER 
I 


Ss 
生态 (Nm 


-Af Wm 


Ss Bn a 
(a) 图 像 轮廓 (b) 手绘 效果 


图 9.2 图 像 轮 廊 和 手绘 效果 的 对 比 


为 了 实现 手绘 风格 ， 即 黑白 轮廓 描绘 ， 首 先 需 要 读 取 原 图 像 的 明暗 变化 ， 即 灰 
度 值 。 从 直观 视觉 感受 上 定义 ， 图 像 灰 度 值 显著 变化 的 地 方 就 是 梯度 ， 它 描述 了 图 
像 灰 度 变 化 的 强度 。 通 常 可 以 使 用 梯度 计算 来 提取 图 像 轮 廓 ，numpy 中 提供 了 直接 
获取 灰 度 图 像 梯度 的 函数 gradient(), 传 入 图 像 数 组 表示 即 可 返回 代表 x 和 y 各 自 方 
向 上 梯度 变化 的 二 维 元 组 。 实 例 代码 17.1 给 出 了 图 像 手 绘 效果 的 全 部 代码 。 


实例 代码 17.1 el7.1HandDrawPic.py 

1 #e19.1lHandDrawPic.py 

必 from PIL import Image 

2 import numpy as np 

a vec el = np.pi/2.2 # 光源 的 俯视 角度 ， 弧 度 值 
5 | vec az = np.pi/4. # 光源 的 方位 角度 ， 弧 度 值 
6 depth = 10. # (0-100) 

7 im = Image.open('fcity.jpg') .convert('L') 

8 a = np.asarray (im) .astype('float') 

9 | grad = np.gradient(a)  # 取 图 像 灰 度 的 梯度 值 
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10 | grad x, grad y = grad # 分 别 取 横 纵 图 像 梯度 值 
11 | grad x = grad x*depth/100. 
12 | grad y = grad y*depth/100. 


13 | dx = np.cos(vec el)*np.cos(vec az) # 光 源 对 x 轴 的 影响 
14 | dy = np.cos(vec el)*np.sinl(vec az) # 光 源 对 y 轴 的 影响 
15 | dz = np.sinl(vec el) # 光 源 对 z 轴 的 影响 


16 |A = np.sqrt(grad x**2 + grad y+**2 + 1.) 

17 | uni x = grad x/A 

18 | uni y = grad y/aA 

19 | uni z = 1./A 

20 | a2 = 255*(dx*uni x + dy*+uni y + dz*uni _z) # 光 源 归 一 化 
21 | a2 = a2.clip(0,255) 

22 | im2 = Image.fromarray (a2.astype('uint8')) # 重 构图 像 
23 | im2.save('fcityHandDraw .jpg') 


手绘 图 像 的 基本 思想 是 利用 像素 之 间 的 梯度 值 〈 而 不 是 像素 本 身 ) 重 构 每 个 像 
素 值 。 为 了 体现 光照 效果 ， 设 计 一 个 光源 ， 建 立 光 源 对 各 点 梯度 值 的 影响 函数 ， 进 
而 运算 出 新 的 像素 值 ， 从 而 体现 边界 点 灰 度 变化 ， 形 成 手绘 效果 。 

具体 来 说 ， 为 了 更 好 地 体现 立体 感 ， 增 加 一 个 z 方向 梯度 值 ， 并 给 x 和 yy 方 向 
梯度 值 赋 权 值 depth。 这 种 坐标 空间 变化 相当 于 给 物体 加 上 一 个 虚拟 光源 , 根据 灰 度 
值 大 小 模拟 各 部 分 相对 于 人 视角 的 远近 程度 ， 使 画面 显得 有 “深度 ”。 

在 利用 梯度 重 构图 像 时 ， 对 应 不 同 梯度 取 0 一 255 之 间 不 同 的 灰 度 值 ，depth 的 
作用 在 于 调节 这 个 对 应 关系 。depth 较 小 时 , 背景 区 域 接近 和 白色, 画面 显示 轮廓 描绘 ; 
depth 较 大 时 ， 整 体 画 面 灰 度 值 较 深 近似 于 浮雕 效果 。 

将 光源 定义 为 3 个 参数 : 方位 角 vec_az、 俯 视角 vec_el 和 深度 权 值 depth。 两 
个 角度 的 设 定 和 单位 向 量 构成 了 基础 的 柱 坐 标 系 , 体现 物体 相对 于 虚拟 光源 的 位 置 ， 
如 实例 代码 17.1 的 第 4 到 第 6 行 。 

通过 np.gradient() 函 数 计算 图 像 梯度 值 作为 新 色彩 计算 的 基础 ,为 了 更 直观 地 进 
行 计算 ， 可 以 把 角度 对 应 的 柱 坐 标 转化 为 xyz 立体 坐标 系 。dx、dy、dz 是 像素 点 在 
施加 模拟 光源 后 在 x、y、z 方 向 上 明 瞳 度 变化 的 加 权 向 量 ， 如 代码 第 13 到 第 15 行 。 

A 是 梯度 幅 值 ， 也 是 梯度 大 小 。 各 个 方向 上 总 梯度 除 以 幅 值得 到 每 个 像素 单元 
的 梯度 值 。 利 用 每 个 单元 的 梯度 值 和 方向 加 权 向 量 合成 灰 度 值 ，clip 函数 用 于 预防 
汶 出 ， 并 归 一 化 到 0 一 255 区 间 。 最 后 从 数组 中 恢复 图 像 并 保存 。 

由 于 手绘 图 像 算法 涉及 三 维 空间 上 映射， 请 读者 尽量 理解 ， 并 通过 修改 其 中 参数 
获得 更 多 效果 。 


思考 与 练习 
9.6 numpy 的 ndarray 类 型 表示 的 彩色 图 像 是 几 维 ? 
9.7 ”如 何 将 彩色 图 片 转换 成 灰 度 图 片 ? 之 后 如 何 处 理 每 一 个 像素 ? 
9.8 ”哪个 函数 能 将 numpy 的 ndarray 类 型 变 成 图 像 ? 
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9.4 模块 9: matplotlib 库 的 使 用 


要 点 : ”matplotlib 是 提供 数据 绘图 功能 的 第 三 方 库 , 其 pyplot 子 库 主要 用 于 
实现 各 种 数据 展示 图 形 的 绘制 。 


Se 


Se 


9.4.1 matplotlib.pyplot 库 概 述 


matplotlib.pyplot 是 matplotlib 的 字库 ， 引 用 方式 如 下 : 图 片 资料 : 
- Python NE 
Dort matplotlib. pyplot as p1t 攻 了 之 2 Hib 库 库 


上 述 语句 与 import matplotlib.pyplot 一 致 ，as 保留 字 与 import 一 起 使 用 能 够 改 
变 后 续 代 码 中 库 的 命名 空间 ， 有 助 于 提高 代码 可 读 性 。 简 单 地 说 ， 在 后 续 程 序 中 ， 
plt 将 代替 matplotlib.pyplot。 

为 了 正确 显示 中 文字 体 , 请 用 以 下 代码 更 改 默 认 设置 ,其 中 'SimHei' 表 示 黑 体 字 。 


>>>import matplotlib 
Wat ie ‘Eont. et 


“字体 是 计算 机 明示 字符 的 方式 ， 均 央 人 工 设 计 ， 并 采用 字体 库 方 式 部 血 在 计 ， 
' 算 机 中 。 西 文 和 中 文字 体 都 有 很 多 种 类 ， 表 9.8 给 出 最 常用 的 10 种 中 文字 体 及 其 ， 
| 英文 表示 ， 这 些 字体 的 英文 表示 在 程序 设计 中 十 分 常用 ， 但 需要 注意 ， 部 分 字体 ， 
! 无 法 在 matplotlib 库 中 使 用 。 


< 一 一 一 ~ 一 一 一 一 = 一 一 ~ 一 一 一 一 一 一 一 一 一 一 一 一 ~ 一 -一 ~ 一 ~ 一 ~ 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 卫 


二 局 


表 9.8 字体 名 称 的 中 英文 对 照 


字体 名 称 字体 英文 表示 
宋体 SimSun 

黑体 SimHei 

楷体 KaiTi 

微软 雅 黑 Microsoft YaHei 
隶书 LiSu 

仿宋 FangSong 

幼 圆 YouYuan 

华文 宋体 STSong 

华文 黑体 STHeiti 


苹果 丽 中 黑 Apple LiGothic Medium 
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matplotlib 库 由 一 系列 有 组 织 有 隶属 关系 的 对 象 构成 , 这 对 于 基础 绘图 操作 来 说 
显得 过 于 复杂 。 因 此 ，matplotlib 提供 了 一 套 快捷 命令 式 的 绘图 接口 函数 ， 即 pyplot 
子 模块 。pyplot 将 绘图 所 需要 的 对 象 构建 过 程 封装 在 函数 中 ， 对 用 户 提 供 了 更 加 友 
好 的 接口 。pyplot 模块 提供 一 批 预定 义 的 绘图 函数 ， 大 多 数 函 数 可 以 从 函数 名 辨别 
它 的 功能 。 


9.42 matplotlib.pyplot 库 解 析 


从 本 节 开 始 ， 使 用 plt 代替 matplotlib.pyplot。plt 子 库 提 供 了 一 批 操作 和 绘图 函 
数 ， 每 个 函数 代表 对 图 像 进 行 的 一 个 操作 ， 比 如 创建 绘图 区 域 、 添 加 标注 或 者 修改 
坐标 轴 等 。 这 些 函 数 采 用 plt.<b>0 形 式 调用 ， 其 中 <b> 是 具体 函数 名 称 。 

plt 子 库 中 包含 了 4 个 与 绘图 区 域 有 关 的 函数 ， 如 表 9.9 所 示 。 


表 9.9 plt 库 的 绘图 区 域 函 数 ( 共 4 个 ) 


plt.figure(figsize=None, 创建 一 个 全 局 绘图 区 域 
facecolor=None) 
创建 一 个 坐标 系 风格 的 子 绘图 区 域 

在 全 局 绘图 区 域 中 创建 一 个 子 绘图 区 域 


调整 子 绘图 


plt.axes(rect, axisbg='w) 


plt.subplot(nrows, ncols, plot number) 
plt.subplots_adjust() 


使 用 figureO 函 数 创建 一 个 全 局 绘图 区 域 ,并且 使 它 成 为 当前 的 绘图 对 象 , fgsize 
参数 可 以 指定 绘图 区 域 的 宽度 和 高 度 ， 单 位 为 英寸 。 鉴 于 figure() 函 数 参数 较 多 ， 这 
里 采用 指定 参数 名 称 的 方式 输入 参数 。 


绘制 图 像 之 前 也 可 不 调用 figure(O 函 数 创建 全 局 绘图 区 域 ， 此 时 ，plt 子 库 会 自 
动 创建 一 个 默认 的 绘图 区 域 。 显 示 绘 图 区 域 的 代码 如 下 : 


subplotO 用 于 在 全 局 绘图 区 域内 创建 子 绘 图 区 域 ， 其 参数 表示 将 全 局 绘图 区 域 
分 成 nrows 行 和 ncols 列 ， 并 根据 先行 后 列 的 计数 方式 在 plot number 位 置 生成 一 个 
坐标 系 ， 实 例 代码 如 下 ，3 个 参数 关系 如 图 9.3 所 示 。 其 中 ， 全 局 绘图 区 域 被 分 割 
成 3X2 的 网 格 ， 其 中 ， 在 第 4 个 位 置 绘制 了 一 个 坐标 系 。 


axes() 默 认 创 建 一 个 subplot(111) 坐 标 系 , 参数 rec = [left,bottom,width,height] 中 4 
个 变量 的 范围 都 为 [0,1]， 表 示 坐 标 系 与 全 局 绘图 区 域 的 关系 ; axisbg 指 背景 色 ， 默 
认为 white。 
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语 | Figure 1 一 口 x 


图 9.3 ”subplot() 函 数 的 参数 关系 


1 


>>> plt.axes([0.1, 0.1, 0.7, 0.3], axi 


>>> plt.show() 


plt 子 库 提供 了 一 组 读 取 和 显示 相关 的 函数 , 用 于 在 绘图 区 域 中 增加 显示 内 容 及 
读 入 数据 ， 如 表 9.10 所 示 ， 这 些 函 数 需 要 与 其 他 函数 搭配 使 用 ， 此 处 读者 有 所 了 解 
即 可 。 


表 9.10 ”plt 库 的 读 取 和 显示 函数 ( 共 6 个 ) 


函数 描述 
plt.legend() 在 绘图 区 域 中 放置 绘图 标签 (也 称 图 注 ) 
plt.show() 显示 创建 的 绘图 对 象 
plt.matshow() 在 窗口 显示 数组 矩阵 
plt.imshow() 在 axes 上 显示 图 像 
plt.imsave() 保存 数组 为 图 像 文件 
plt.imread() 从 图 像 文件 中 读 取 数组 


pyplot 模块 提供 了 17 个 用 于 绘制 “基础 图 表 ” 的 常用 函数 ， 如 表 9.11 所 示 。 
表 9.11 plt 库 的 基础 图 表 函 数 〈 共 17 个) 


根据 x、y 数组 绘制 二、 曲线 
绘制 一 个 箱 型 图 (Box-plot) 
绘制 一 个 条 形 图 
绘制 一 个 横向 条 形 图 
绘制 极 坐 标 图 


plt.polt(x, y, label, color, width) 
plt.boxplot(data, notch, position) 
plt.bar(left, height, width, bottom) 
plt.barh(bottom, width, height, left) 
plt.polar(theta, r) 
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续 表 
操 “ 作 摘 述 
plt.pie(data,explode) 绘制 饼 图 
plt.psd(x, NFFT=256, pad to, Fs) 绘制 功率 谱 密 度 图 
plt.specgram(x, NFFT=256, pad_to, F) 绘制 谱 图 
plt.cohere (x, y, NFFT=256, Fs) 绘制 X-Y 的 相关 性 函数 
plt.scatter() 绘制 散 点 图 (x、y 是 长 度 相同 的 序列 ) 
plt.step(x, y, where) 绘制 步 阶 图 
plt.hist(x, bins, normed) 绘制 直方 图 
plt.contour(X, Y, Z, N) 绘制 等 值 线 
plt.vlines() 绘制 牌 直线 
plt.stem(x, y, linefmt, markerfmt, basefmt) ”| 绘制 曲线 每 个 点 到 水 平 轴线 的 垂 线 
pltplot date0) 绘制 数据 日 期 
plt.plotfile() 绘制 数据 后 写 入 文件 


plotO 函 数 是 用 于 绘制 直线 的 最 基础 的 函数 ， 调 用 方式 很 灵活 ，x 和 y 可 以 是 
numpy 计算 出 的 数组 ， 并 用 关键 字 参 数 指定 各 种 属性 。 其 中 ，label 表示 设置 标签 并 
在 图 例 〈legend) 中 显示 ，color 表示 曲线 的 颜色 ，linewidth 表示 曲线 的 宽度 。 在 字 
符 串 前 后 添加 “$” 符 号 ，matplotlib 会 使 用 其 内 置 的 latex 引擎 绘制 数学 公式 。 

【 微 实例 9.1】 绘制 基本 的 三 角 函 数 。 

在 坐标 系 中 绘制 基本 的 三 角 函 数 ， 代 码 如 下 ， 绘 制 效果 如 图 9.4 所 示 。 


微 实例 9.1 m9.1PlotTriangle.py 

J import numpy as np 

2 import matplotlib.pyplot as plt 

3 x = np.linspace(0, 6, 100) 

4 Y = np.cos(2 * np.pi + x) + np.exp(-x)+0.8 

5 Plt.plot(x, y, 'k', color='r', linewidth=3, linestyle="-" 
6 Plt.show() ， 


0 1 之 3 4 总 6 
图 9.4 微 实 例 9.1 的 绘制 效果 
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plt 库 有 两 个 坐标 体系 : 图 像 坐 标 和 数据 坐标 。 图 像 坐标 将 图 像 所 在 区 域 左 下 角 
视 为 原点 ， 将 x 方向 和 vy 方向 长 度 设 定 为 1。 整体 绘图 区 域 有 一 个 图 像 坐 标 ， 每 个 
axes() 和 subplot0) 函 数 产生 的 子 图 也 有 属于 自己 的 图 像 坐标 。axes() 函 数 参数 rect 指 
当前 产生 的 子 区 域 相 对 于 整个 绘图 区 域 的 图 像 坐 标 。 数 据 坐 标 以 当前 绘图 区 域 的 坐 
标 轴 为 参考 ， 显 示 每 个 数据 点 的 相对 位 置 ， 这 与 坐标 系 里 面 标记 数据 点 一 致 。 


表 9.12 给 出 了 与 plt 库 的 坐标 轴 设 置 相关 的 函数 ， 实 例如 下 。 


表 9.12 ”pit 库 的 坐标 轴 设 置 函数 〈 共 9 个 ) 


函数 


Ss 要 
plt.axis('v','off','equal','scaled','tight',image') 获取 设置 轴 属 性 的 快捷 方法 
plt.xlim(xmin, xmax) 设置 当前 x 轴 取 值 范围 
plt.ylim(ymin,ymax) 设置 当前 > 轴 取 值 范围 
plt.xscale() 设置 x 轴 缩 放 
plt.yscale() 设置 7 轴 缩 放 
plt.autoscale() 自动 缩放 轴 视 图 的 数据 
plt.text(x,y,s,fontdic,withdash) 为 axes 图 轴 添 加 注释 
plt.thetagrids(angles, labels, fmt, frac) 设置 极 坐 标 网 格 theta 的 位 置 
plt.grid(on/off) 打开 或 者 关闭 坐标 网 格 


表 9.13 给 出 了 13 个 设置 坐标 系 标签 的 相关 函数 。 


表 9.13 plt 库 的 标签 设置 函数 ( 共 13 个 ) 
i 
plt.figlegend(handles, label, loc) 为 全 局 绘图 区 域 放置 图 注 
plt.legend() 为 当前 坐标 图 放置 图 注 
plt.xlabel(s) 设置 当前 x 轴 的 标签 
plt.ylabel(s) 设置 当前 了 轴 的 标签 


plt.xticks(array, 'a', 'b', 'c) 
plt.yticks(array, 'a', 'b', 'c') 


设置 当前 x 轴 刻 度 位置 的 标签 和 值 
设置 当前 y 轴 刻度 位 置 的 标签 和 值 


plt.clabel(cs,v) 为 等 值 线 图 设置 标签 

plt.get figlabels() 返回 当前 绘图 区 域 的 标签 列表 
plt.figtext(x, y, s, fontdic) 为 全 局 绘图 区 域 添加 文字 
plt.title() 设置 标题 

plt.suptitle() 为 当前 绘图 区 域 添加 中 心 标题 
plt.text(x, y, s, fontdic, withdash) 为 坐标 图 轴 添 加 注释 


plt.annotate(note, xy, xytext, xycoords, 
textcoords, arrowprops) 


用 箭头 在 指定 数据 点 创建 一 个 注释 或 一 段 文 本 
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【 微 实例 9.2】 带 标签 的 坐标 系 。 
绘制 一 个 带 标签 的 坐标 系 ， 代 码 如 下 ， 绘 制 效果 如 图 9.5 所 示 。 


微 实例 9.2 m9.2PlotCoordinate.py 
1 import matplotlib.pyplot as plt 
分 import matplotlib 
3 matplotlib.rcParams['font.family']='SimHei' 
a matplotlib.rcParams['font.sans-serif' ] = ['SimHei'] 
号 plt.plot([1,2,4], [1,2,3]) 
6 | PLt.title(" 坐 标 系 标题 ") 
7 | plt.xlabel(' 时 间 (s) ') 
8 | plt.ylabel(' 范 围 (m) ') 
9 | plt.xticks([1,2,3,4,5],[r'$\pi/3$', r'$2\pi/3$', r'$\pi$',\ 
r'$4\pi/3$', r'$5\pi/3$']) 
10 | plt.show() 
坐标 系 标 题 
3.0 RE T 


2.5 


2.0 


范围 (m) 


T/3 2r/3 n 4m3 $n/3 
时 间 (s) 


图 9.5 微 实 例 9.2 的 绘制 效果 
plt 库 提 供 了 3 个 区 域 填充 函数 ， 对 绘图 区 域 填充 颜色 ， 如 表 9.14 所 示 。 
表 9.14 plt 库 的 区 域 填充 函数 ( 共 3 个 ) 


函 数 描 ” 述 
fill(x,y,c,color) 填充 多 边 形 
fill_ between(x,y1,y2.where,color) 填充 两 条 曲线 围 成 的 多 边 形 
fill betweenx(y,x1,x2,where,hold) 填充 两 条 水 平 线 之 间 的 区 域 


【 微 实例 9.3】 和 带 局 部 阴影 的 化 标 系 。 
绘制 一 个 带 局 部 阴影 的 坐标 系 ， 代 码 如 下 ， 绘 制 效果 如 图 9.6 所 示 。 
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微 实例 9.3 m9.3PlotDarkCoordinate.py_ 源 代码 9-4 i 
带 局 部 阴影 的 坐 

1 | import matplotlib.pyplot as plt 标 系 绘制 
人 import numpy as np 

学 x = np.linspace(0, 10, 1000) 

4 Y = np.cos (2*np.pi*x) * np.exp(-x)+0.8 

号 plt.plot(x,y,'k',color='r',label="$exp-decay$" ,Linewidth=3) 

6 | plt.axis([0,6,0,1.8]) 

7 ix = (x>0.8) & (x<3) 

8 Plt.fill between(x, y ,0, where = ix,\ 


facecolor='grey', alpha=0 .25) 
9 plt.text(0.5*(0.8+3), 0.2, r"$\int a^b f(x)\mathrm{d}x$",\ 
horizontalalignment="'center') 
10 | pilt.1legend!() 
11 | Plt.show'() 


ep ey 


3 
图 96 微 实 例 9.3 的 绘制 效果 


思考 与 练习 
9.9 如 何在 一 个 绘制 区 域 中 绘制 上 下 两 个 坐标 系 ? 
9.10 一 个 专业 的 科学 坐标 系 都 有 哪些 组 成 部 分 ? 
9.11 利用 matplotlib 绘制 函数 曲线 的 最 精简 代码 是 什么 ? 


9.5 实例 18: 科学 坐标 图 绘制 
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采用 坐标 系 绘制 和 展示 数据 趋势 是 经 常 使 用 的 功能 ， 掌 握 绘制 专业 的 科学 坐标 
系 将 会 为 生活 和 工作 提供 更 高 效 的 支持 。 

科学 坐标 图 有 4 个 要 素 : 坐标 轴 、 数 据 曲 线 、 标 题 和 图 注 。 这 个 实例 以 阻尼 衰 
减 曲 线 绘 制 来 具体 阐述 科学 坐标 系 的 绘制 方法 。 

本 实例 同时 展示 了 在 同一 个 区 域 用 不 同 颜色 和 线条 绘制 两 种 曲线 的 方法 ， 两 条 
曲线 分 别 为 (x,y) 和 (x,z)， 绘 制 效果 如 图 9.7 所 示 。 


阻尼 衰减 曲线 绘制 


一 expuecay 
-—- coOs(x2) 


cos(2rt)exp( 一 1 


会 访 
E 
其 
萱 
2n/3 qd 
时 间 (s) 
图 9.7 阻尼 衰减 曲线 坐标 图 绘制 
2 实例 代码 18.1 如 下 : 
实例 代码 18.1 el18.1PlotDamping.py 


和 #e20 .1PlotDamping.py 

2 import numpy as np 

3 import matplotlib.pyplot as pilt 

4 import matplotlib 

5 matplotlib.rcParams['font.family']='SimHei' 

6 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] 

7 def Drawl(pcolor, nt . Point, nt text, nt size): 

8 Plt.plot(x, y, 'k', label="$exp decay$", color=pcolor,\ 
linewidth=3, linestyle="-") 

9 Plt.plot(x, z, "b--", label="$cos (x^2)$", linewidth=1) 

10 Plt.xlabel(' 时 间 (s)') 

pe Plt.ylabel(' 幅 度 (mV) ') 


i Plt.title ("阻尼 衰减 曲线 绘制 ") 
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13 plt.annotate('$\cos(2 \Pi t) \exp(-t)$', xy=nt point, \ 
xytext=nt text, fontsize=nt size,arrowprops= \ 
dict(arrowstyle='->', connectionstyle="arc3,rad=.1")) 
14 def Shadow (a, b): 


15 ix = (x>a) & (x<b) 
16 Plt.fill between (x,y, 0,where=ix,facecolor='grey' ,alpha=0 .25) 
相生 plt.text(0.5 * (a + b), 0.2, r"$\int a^b 工 (x) \mathrm{d}x$",\ 


horizontalalignment='center') 
18 def XY Axis(x start, x end, y_start, Y_end) : 


19 plt.xlim(x start, x_end) 
20 plt.ylim(y start, y_end) 
ZF plt.xticks([np.pi/3, 2 + np.pi/3, 1 * np.pi, 4 * np.pi/3,\ 


S*np.pi/3],['$\pi/3$','$2\pi/3$','$\pi$','$4\pi/3$','$5\pi/3$']) 
22 |x = np.linspace(0.0, 6.0, 100) 

23 |Y= np.cos(2 + np.pi * x) * np.exp(-x)+0.8 

24 z= 0.5 * np.cos(x +** 2)+0.8 

25 | note point,note text,note size=(1 ,np.cos(2*np.pi) *\ 
26 | np.exp(-1)+0.8),(1, 1.4), 14 

27 fig = plt.figure (figsize=(8, 6), facecolor="white") 
28 | Plt.subplot(111) 

29 | Draw("red", note point, note text, note size) 

30 | XY Axis(0, 5, 0, 1.8) 

31 Shadow (0.8, 3) 

32 | PlLt. Legend() 

33 | Plt.savefig('sample.JPG') 

34 | Plt.show!() 


为 了 便于 阅读 ， 程 序 设 计 了 Draw0O、Shadow0 和 XY_Axis() 函 数 ， 分 别 用 于 绘 
制 曲线 、 设 置 阴影 和 修改 坐标 轴 。 第 13 行 annotate0 函 数 配合 箭头 在 曲线 绘图 界面 
添加 动态 注释 ， 第 头 的 线条 和 尖端 都 有 多 种 样式 和 参数 ， 可 以 通过 arrowprops 和 
connectionstyle 选择 ,具体 请 参考 官方 文档 。plt.savefig() 函 数 能 够 将 产生 的 坐标 图 保 
存 为 文件 。 

实例 代码 18.1 中 所 有 代码 均 已 在 9.4 节 中 介绍 ， 请 读者 阅读 并 运行 代码 ， 理 解 
编写 科学 坐标 系 的 方法 。 

据 展 : 科学 计算 可 视 化 


! 可视化 技术 与 科学 计算 相 结合 形成 了 可 视 化 技术 的 一 个 重要 分 
' 计算 可 视 化 (Visualization in Scientific Computing)。 ee rm 
! 测量 获得 的 数值 、 图 像 或 计算 产生 的 数字 信息 等 以 直观 的 图 形 图 像 方式 展示 。 通 


过 直观 展示 ， 宇 宙 空 间 有 了 颜色 ， 物 理 现象 更 为 直观 ， 感 性 理解 和 理性 求证 相 辅 
相 成 ， 共 同 促进 科学 计算 的 深入 发 展 ， 


os 
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思考 与 练习 
9.12 ”解释 实例 代码 18.1 第 13 行 代码 的 含义 。 
9.13 ”解释 实例 代码 18.1 第 32 行 图 注 中 的 内 容 在 哪里 设 定 。 
9.14 解释 实例 代码 18.1 绘制 曲线 的 颜色 和 线形 在 哪里 设 定 。 


9.6 实例 19: 多 级 雷达 图 绘制 


雷达 图 是 通过 多 个 离散 属性 比较 对 象 的 最 直观 工具 ， 掌 握 绘 制 雷达 图 的 方法 将 
会 为 生活 和 工作 带 来 乐趣 。 
游戏 角色 中 经 常 出 现 表 示人 物 能 力 值 的 雷达 图 . DOTAMAX 测试 版 曾经 推出 过 
显示 玩家 能 力 值 分 布 的 雷达 图 ， 只 要 点 击 自 己 或 好 友 头 像 ， 就 可 以 看 到 能 力 值 在 综 
合 、KDA、 发 育 、 推 进 、 生 存 、 输 出 等 方面 的 分 布 ， 如 图 9.8 所 示 。 
DOTA 能 力 值 雷达 图 


图 98 DOTA 人 物 能 力 值 涯 达 图 


本 实例 使 用 Python 来 绘制 这 样 的 多 级 雷达 图 , 即 在 一 组 同心 圆 上 填充 不 规则 六 
边 形 ， 其 每 个 顶点 到 圆心 的 距离 代表 人 物 数据 的 某 个 属性 。 实 例 代码 19.1 如 下 : 


口 实例 代码 19.1 e19.1DrawDotaRadar.py 


1 #e21 .1lDrawDotaRadar.py 
Ee: import numpy as np 
3 import matplotlib.pyplot as plt 
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4 import matplotlib 

如 matplotlib.rcParams['font.family']="'SimHei' 

6 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] 

7 | labels = np.array([' 综 合 ', 'KDA', ' 发 育 ',' 推 进 ',' 生 存 ', ' 输 出 ']) 
8 naAttr = 6 

9 | data = np.array([7，5，6，9，8，7]) # 数 据 值 

10 angles = np.linspace(0, 2*np.pi, nAttr, endpoint=False) 
11 | data = np.concatenate((data, [data[0]])) 

12 | angles = np.concatenate((angles, [angles[0]])) 

13 fig = plt.figure (facecolor="white") 

14 Plt.subplot (111, polar=True) 

15 | plt.plot(angles,data,'bo-',color ='g',linewidth=2) 

16 | plt.fill(angles,data,facecolor='g' ,alpha=0 .25) 

17 | plt.thetagrids (angles*180/np.pi, labels) 

18 | plt.figtext(0.52，0.95，,，'DOTA 能 力 值 雷达 图 '，ha='center') 
19 | plt.grid(True) 

20 | plt.savefig('dota radar.JPG') 

21 | plt.show() 


实例 代码 19.1 中 第 4 到 第 6 行 用 于 支持 中 文 。 由 于 DOTA 实例 包含 6 个 属性 ， 
设置 属性 标签 labels， 并 预 设 一 组 玩家 数据 data。 

np.linspaces() 函 数 设 定 起 点 为 0、 末 值 为 2r、 返 回 一 个 两 端点 间 数 值 平 均 分 布 
的 长 为 nAttr 的 数组 angles, 它 表 示 从 一 个 属性 点 到 下 一 个 属性 点 笔画 需要 旋转 的 角 
度 ， 它 取决 于 属性 nAttr 的 大 小 ， 也 是 雷达 图 的 多 边 形 边 数 。 

np.concatenate() 函 数 用 于 将 数据 和 和 角度 的 数组 首尾 闭合 起 来 便于 调用 plotO 函 
数 绘制 。 

建立 基本 绘图 对 象 后 ， 使 用 subplot0 函 数 建立 极 坐 标 系 的 子 分 区 。polar 参数 指 
定 了 绘制 类 型 为 极 坐标 ， 这 是 subplot0) 除 默认 正方 形 坐 标 系 外 唯一 支持 的 内 署 坐 标 
图 。 建 立 极 坐标 后 ， 使 用 plotO 函 数 依照 data 提供 的 数据 画 出 不 规则 六 边 形 ， 然 后 
使 用 fll0 函 数 填充 半 透 明 颜色 。thetagrids() 函 数 为 极 坐 标 设置 标签 ， 这 里 把 标签 安 
放 在 六 角形 的 顶点 上 ， 需 要 将 角度 数据 和 文字 一 起 作为 参数 传 给 thetagrids 函数 。 

除了 DOTA 游戏 ， 雷 达 图 应 用 广泛 。 再 看 一 个 例子 。 美 国 约翰 霍 普 金 斯 大 学 霍 
兰 德 教授 认为 兴趣 是 人 们 活动 的 巨大 动力 ， 凡 是 具有 职业 兴趣 的 职业 ， 都 可 以 提高 
人 们 的 积极 性 ， 促 使 人 们 积极 地 、 愉 快 地 从 事 该 职业 。 因 此 ， 他 研究 了 人 格 类 型 、 
兴趣 与 职业 间 的 关系 ,提出 了 “ 霍 兰 德 职业 兴趣 理论 ”认为 人 格 可 分 为 现实 型 、 研 
究 型 、 艺 术 型 、 社 会 型 、 企 业 型 和 常规 型 6 种 类 型 。 

丘 展 : 兴趣 是 最 好 的 老师 

爱 因 斯 坦 说 过 , “兴趣 是 最 好 的 老师 >。 兴 趣 来 源 于 好 奇 ， 好 奇 心 则 是 人 类 与 ， 
! 生 俱 来 的 。 如 果 读 者 对 本 书 设计 的 实例 感到 好 奇 ， 这 说 明 ， 你 已 经 找到 了 最 好 的 
! 老师 。 全 书 共 25 个 实例 ， 绝 大 部 分 为 作者 结合 实际 教学 效果 原创 制作 ， 它 们 将 
' 为 读者 带 来 学 习 Python 语言 的 最 佳 体验 。 


区 
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展示 霍 兰 德 人 格 分 析 最 有 效 的 工具 是 雷达 图 。 以 工程 师 、 实 验 员 、 艺 术 家 、 推 
销 员 、 社 会 工作 者 、 记 事 员 6 个 职业 数据 为 例 ， 实 例 代码 19.2 给 出 了 霍 兰 德 人 格 分 
析 绘 制 的 雷达 图 ， 不 同 职业 间 的 区 别 非常 直观 。 实 例 代码 19.2 如 下 ， 运 行 结果 如 图 
9.9 所 示 。 


实例 代码 19.2 e19.2DrawHollandRadar.py 

1 #e22.1DrawHollandRadar 

2 import numpy as np 

3 import matplotlib.pyplot as plt 

4 import matplotlib 

与 matplotlib.rcParams['font.family']='SimHei' 

6 matplotlib.rcParams['font.sans-serif'] = ['SimHei'] 

7 | radar labels = np.array([' 研 究 型 (I)',' 艺 术 型 (A) ',' 社 会 型 (Ss) ',\ 


' 企 业 型 (E) ',' 常 规 型 (C) '，' 现 实 型 (R) ']) 
8 | nAttr = 6 
9 | data = np.array([[0.40, 0.32, 0.35, 0.30, 0.30, 0.88], 


10 [0.85, 0.35, 0.30, 0.40, 0.40, 0.30], 
11 [0.43, 0.89, 0.30, 0.28, 0.22, 0.30], 
12 [0.30, 0.25, 0.48, 0.85, 0.45, 0.40], 
J 总 [0.20, 0.38, 0.87, 0.45, 0.32, 0.28], 
14 [0.34，0.31，0.38，0.40，0.92，0.28]]) # 数 据 值 


15 | data_labels=(' 工 程 师 ' ，' 实 验 员 ' ，' 艺术 家 ' ，' 推 销 员 '，' 社会 工作 者 !，' 记事 员 ' ) 
16 | angles = npPp.1LinsPace(0，2xrnP.Pi，nRAttr，endpoint=EFalse) 

17 | daata = np.concatenate( (data, [data[0]])) 

18 | angles = np.concatenate((angles, [angles[0]])) 

19 | Eig = plt.figure (facecolor="white") 

20 | plt.subplot(111, polar=True) 

21 | plt.plot(angles,data,'bo-',color ='gray',linewidth=1,alpha=0 .2) 


23 | plt.plot(angles,data,'o-', linewidth=1.5, alpha=0.2) 

24 | plt.£fill (angles,data, alpha=0 .25) 

25 | Plt.thetagrids (angles*180/np.pi, radar labels,frac = 1.2) 

26 | PILt.figtext(0.52，0.95，' 霍 兰 德 人 格 分 析 ' ，ha='center' ，size=20) 
27 | legend=plt.legend(data labels,loc=(0.94,0.80),1labelspacing=0.1) 
28 | Plt.setp(legend.get texts(), fontsize='small') 

29 | plt.grid(True) 

30 | Plt.savefig('holland radar.JPG') 

31 | plt.show() 


实例 代码 19.1 和 实例 代码 19.2 分 别 给 出 了 绘制 单一 数据 雷达 图 和 多 数据 雷达 
图 的 方法 ， 是 不 是 很 有 趣 ? 
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霍 兰 德 人 格 分 析 


es 工程 师 

es 实验 员 

”= 艺术 家 

“全 推销 员 

s-* 社会 工作 者 
1.0 记事 员 


艺术 型 (A) 


企业 型 (E) 研究 型 (D 


图 9.9 截 兰 德 人 格 分 析 雷 达 图 


思考 与 练习 
9.15 ”解释 实例 代码 19.1 第 14 行 代码 的 含义 。 
9.16 解释 实例 代码 19.1 第 18 行 代码 的 含义 。 
9.17 解释 实例 代码 19.2 第 27 行 代码 的 含义 。 


本 章 以 科学 计算 和 可 视 化 为 中 心 ， 了 两 个 强大 的 工具 库 numpy 和 
matplotlib.pyplot， 通 过 生成 手绘 风格 图 片 、 绘 制 科学 坐标 系 和 绘制 雷达 图 等 实例 展 
示 了 Python 在 科学 计算 方面 的 强大 功能 。 


程序 练习 题 


9.1 方 波 绘制 。 在 信号 处 理 理论 中 ， 方 波 可 近似 表示 为 多 个 正弦 波 的 又 加 。 事 
实 上 , 任意 一 个 方 波 信号 都 可 以 使 用 傅 里 叶 变 换 为 多 个 正弦 波 表示 。 利用 numpy 和 叫 
matplotlib 在 坐标 系 中 绘制 方 波 的 无 穷 级 数 表示 。 请 尝试 调节 正弦 波 的 个 数 、 幅 度 以 国 
及 周期 ， 尽 可 能 使 方 波 边缘 平滑 。 方 波 无 穷 级 数 表达 式 如 下 : 

4sin(2k — 1)t 
/= ee (2k—1)n 
9.2 ”心脏 线 绘制 。 币 卡 儿 心 形 线 也 称 为 心脏 线 ， 它 是 有 一 个 尖 点 的 外 摆 线 。 当 
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一 个 圆 沿 着 另 一 个 半径 相同 的 圆 滚动 时 ， 圆 上 一 点 的 轨迹 就 是 心脏 线 。 请 调研 笛 卡 
儿 心 形 线 ， 并 使 用 numpy 和 matplotlib 绘制 一 条 笛 卡 儿 心 形 线 。 

9.3 自 定义 手绘 风 。 修 改 实例 17， 使 手绘 效果 更 符合 你 的 审美 特点 。 

9.4 和 上 自 定义 规律 绘制 。 参 考 实例 18， 绘 制 你 感 兴趣 的 一 个 数学 或 物理 规律 。 

9.5 乒乓 选手 雷达 图 绘制 。 参 考 实 例 19， 为 中 国 乒 乓 球 选手 绘制 雷达 图 ， 至 
少 建立 4 个 属性 值 。 
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矿 弄 加 会 琉 扩 从 维 i11I 北 令 去 砍 末 ， 避 起 好 算 ， 信 妇 起 杯 牙 。 
The good news about computers is that they do what you tell them to do. The bad 


news is that they do what you tell them to do. 
一 一 泰 德 。 尼尔森 〈Ted Nelson) 


信息 技术 先驱 、 超 文本 传输 协议 CHTTP) 的 设计 者 、 哲 学 家 、 社 会 学 家 


PETE 


(1) 掌握 网 络 聆 虫 的 基本 方法 。 

(2) 运用 requests 库 编写 基本 URL 访问 过 程 。 

(3) 运用 beautifulsoup4 库 解 析 和 处 理 HTML。 

(4) 掌握 向 搜索 引擎 自动 提交 关键 词 并 获取 返回 结果 的 方法 。 


XS- 


人 


似乎 一 瞬间 全 世界 都 开始 讨论 网 络 疏 虫 ， 随 着 网 络 的 迅速 发 展 ， 如 何 有 效 地 提 
取 并 利用 信息 很 大 程度 上 决定 了 解决 问题 的 效率 。 搜 索引 擎 作为 辅助 程序 员 检索 信 
息 的 工具 已 经 有 些 力不从心 。 为 了 更 高 效 地 获取 指定 信息 需要 定向 抓 取 并 分 析 网 页 
资源 ， 网 络 怜 虫 火爆 了 起 来 。 

本 章 将 讲述 编写 优质 网 络 爬 虫 的 方法 ， 咽 ， 别 人 有 的 这 里 也 有 ， 而 且 还 更 好 。 
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ee ee tt 


WE 


Python 语言 发 展 中 有 一 个 里 程 碑 式 的 应 用 事件 ， 即 美国 谷歌 《Google) 公司 在 
和 Python 语言 进行 链接 处 理 和 开发 , 这 是 该 语言 发 展 成 熟 的 重要 标 

。Python 语言 的 简洁 性 和 脚本 特点 非常 适合 链接 和 网 页 处 理 ， 因 此 ， 在 Python 
的 计算 生态 中 ， 与 URL 和 网 页 处 理 相 关 的 第 三 方 库 很 多 。 

万 维 网 C(WWW) 的 快速 发 展 带 来 了 大 量 获取 和 提交 网 络 信 息 的 需求 ， 这 产生 
了 “网 络 仆 虫 ”等 一 系列 应 用 。Python 语言 提供 了 很 多 类 似 的 函数 库 ， 包 括 urllib、 
urllib2、urllib3、wget、scrapy、requests 等 。 这 些 库 作 用 不 同 、 使 用 方式 不 同 、 用 户 
体验 不 同 。 对 于 疏 取 回来 的 网 页 内 容 ， 可 以 通过 re《〈 正 则 表达 式 )、beautifulsoup4 
等 函数 库 来 处 理 。 随 着 该 领域 各 函数 库 的 发 展 ， 本 章 将 详细 介绍 其 中 最 重要 且 最 主 
流 的 两 个 函数 库 : requests 和 beautifulsoup4， 它 们 都 是 第 三 方 库 。 

除了 网 络 息 虫 ， 自 动向 网 站 提交 数据 既 有 趣 双 有用， 这样 的 功能 也 能 通过 
requests 库 实现 。 本 章 将 以 两 个 类 似 例子 介绍 从 网 络 获取 数据 及 向 网 络 提交 数据 的 
方法 。 

网 络 怜 虫 应 用 一 般 分 为 两 个 步骤 : 四 通过 网 络 链接 获取 网 页 内 容 ; 四 对 获得 的 
网 页 内 容 进行 处 理 。 这 两 个 步骤 分 别 使 用 不 同 的 函数 库 : requests 和 beautifulsoup4。 

采用 pip 指令 安装 requests 库 ， 如 果 在 Python 2 和 Python 3 并 存 的 系统 中 ， 采 
用 pip3 指令 ， 代 码 如 下 : 


采用 pip 或 pip3 指令 安装 beautifulsoup4 库 ， 注 意 ， 不 要 安装 beautifulsoup 库 ， 
后 者 由 于 年 久 失 修 ， 已 经 不 再 维护 了 。 安 装 命令 如 下 : 


使 用 Python 语言 实现 网 络 爬 虫 和 信息 提交 是 非常 简单 的 事情 ， 代 码 行 数 很 少 ， 
也 无 须 掌握 网 络 通信 等 方面 的 知识 ， 非常 适合 非 专业 读者 使 有用。 然而， 肆意 地 故 取 
网 络 数据 并 不 是 文明 现象 ， 通 过 程序 自动 提交 内 容 争 取 竞 争 性 资源 也 不 公平 。 就 像 
那些 肆意 的 推销 电话 一 样 ， 他 们 无 视 接听 者 意愿 ， 不 仅 令 人 讨厌 也 有 可 能 引发 法 律 
纠纷 。 


拓展 : Robots 排除 协议 


Robots 排除 协议 (Robots Exclusion Protocol )， 也 被 称 为 爬虫 协议 ， 它 是 网 站 ) ， 
; 管理 者 表达 是 否 希 望 疏 由 自动 获取 网 络 信息 意愿 的 方法 。 管 理 者 可 以 在 网 站 根 目 ， ! 


~ 
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' 议 重点 约定 不 希望 候 虫 获取 的 内 容 ， 如 果 没有 该 文件 则 表示 网 站 内 容 可 以 被 故 虫 ， 
' 获得 ， 然 而 ，Robots 协议 不 是 命令 和 强制 手段 ， 只 是 国际 互联 网 的 一 种 通用 道德 ， 
' 规范。 绝 大 部 分 成 熟 的 搜索 引擎 殷 虫 都 会 遵循 这 个 协议 ， 建 议 个 人 也 能 按照 互联 ， 
! 网 规范 要 求 合 理 使 用 爬虫 技术 。 


os- 


Ss 


思考 与 练习 
10.1 请 思考 网 络 候 虫 的 可 能 应 用 。 


10.2 ”模块 10: requests 库 的 使 用 


a 


-2 


10.2.1 ”requests 库 概 述 


requests 库 是 一 个 简洁 且 简 单 的 处 理 HTTP 请 求 的 第 三 方 库 ， 它 的 最 大 优点 是 
程序 编写 过 程 更 接近 正常 URL 访问 过 程 。 这 个 库 建 立 在 Python 语言 的 urllib3 库 的 
基础 上 ， 类 似 这 种 在 其 他 函数 库 之 上 再 封装 功能 、 提 供 更 友好 函数 的 方式 在 Python 
语言 中 十 分 常见 。 在 Python 生态 圈 里 , 任何 人 都 有 通过 技术 创新 或 体验 创新 发 表意 
见 和 展示 才华 的 机 会 。 

requests 库 支持 非常 丰富 的 链接 访问 功能 ， 包 括 国 际 域名 和 URL 获取 、HTTP 
长 连接 和 连接 缓存 、HTTP 会 话 和 Cookie 保持 、 浏 览 器 使 用 风格 的 SSL 验证 、 基 本 
的 摘要 认证 、 有 效 的 键 值 对 Cookie 记录 、 自 动 解压 缩 、 自 动 内 容 解 码 、 文 件 分 块 上 
传 、HTTP(S) 代 理 功 能 、 连 接 超 时 处 理 、 流 数据 下 载 等 。 有 关 requests 库 的 更 多 介 
绍 请 访问 http://docs.python-requests.org。 


10.2.2 requests 库 解 析 


网 络 爬 虫 和 信息 提交 只 是 requests 库 能 支持 的 基本 功能 ， 本 节 重 点 介绍 与 这 两 
个 功能 相关 的 一 些 常 用 函数 。 其 中 ， 与 网 页 请 求 相关 的 函数 如 表 10.1 所 示 。 


表 10.1 requests 库 中 的 网 页 请 求 函 数 ( 共 6 个 ) 


对 应 于 HITP 的 GET 方式 ， 获 取 网 页 最 常用 的 方法 ， 可 以 增 


get(url [, timeout=n]) 加 timeout=n 参数 ， 设 定 每 次 请 求 超时 时 间 为 n 秒 
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post(url, data = {'key'value'}) | 对 应 于 HTTP 的 POST 方式 ， 其 中 字典 用 于 传递 客户 数据 


delete(url) 对 应 于 HTTP 的 DELETE 方式 
head(url) 对 应 于 HTTP 的 HEAD 方式 
options(url) 对 应 于 HTTP 的 OPTIONS 方式 


put(url, data = fkey':value')) | 对 应 于 HTTP 的 PUT 方式 ， 其 中 字典 用 于 传递 客户 数据 


get0 是 获取 网 页 最 常用 的 方式 ， 在 调用 requests.get() 函 数 后 ， 返 回 的 网 页 内 容 
会 保存 为 一 个 Response 对 象 ， 其 中 ，get0 函 数 的 参数 url 链接 必须 采用 HTTP 或 
HTTPS 方式 访问 ， 例 如 : 


读者 在 深入 了 解 HTTP 协议 后 会 很 快 理解 上 述 函 数 的 用 法 和 意义 ， 本 书 不 过 多 
介绍 ， 从 息 虫 应 用 角度 来 看 ， 只 需要 掌握 getO0 函 数 即 可 获取 网 页 。 

和 浏览 器 的 交互 过 程 一 样 ，requests.get() 代 表 请 求 过 程 ， 它 返回 的 Response 对 
象 代表 响应 。 返回 内 容 作 为 一 个 对 象 更 便于 操作 ，Response 对 象 的 属性 如 表 10.2 所 
示 ， 需 要 采用 <a>.<b> 形 式 。 


be dd 《 共 4 个 ) 


属 全 2 Tn 
status_code HTTP 请 求 的 返回 状态 ， 整数 ，200 表示 连接 成 功 ，- 404 表示 失败 
text HTTP 响应 内 容 的 字符 串 形式 ， 即 url 对 应 的 页 面 内 容 
encoding HTTP 响应 内 容 的 编码 方式 
content HTTP 响应 内 容 的 二 进 制 形式 


status_code Re HTTP 后 的 状态 , 在 处 理 数据 之 前 要 先 判断 状态 情况 ，. 
如 果 请 求 未 被 响应 ， 终止 内 容 处 理 。text 属性 是 请 求 的 页 面 内 容 ， 以 字符 串 形 
式 展 示 。encoding oa 它 给 出 了 返回 页 面 内 容 的 编码 方式 ， 可 以 通过 对 
encoding 属性 赋值 更 改编 码 方式 ， 以 便于 处 理 中 文字 符 。content 属性 是 页 面 内 容 的 
二 进 制 形 式 。 例 如 : 


第 10 章 网络 怜 虫 和 自动 化 265 


>>> .text # 更 改 完成 ， 返 回 内 容 中 的 中 文字 符 可 以 正常 显示 了 
_( 夫 出 略 ) | 


除了 属性 ，Response 对 象 还 提供 一 些 方法 ， 如 表 10.3 所 示 。 


表 10.3 ” Response 对 象 的 方法 ( 共 2 个 ) 


如 果 HTTP 响应 内 容 包含 JSON 格式 数据 ， 则 该 方法 解析 JSON 数据 
如 果 不 是 200， 则 产生 异常 


json() 


raise for status() 


json() 方 法 能 够 在 HITP 响应 内 容 中 解析 存在 的 JSON 数据 ,这 将 带 来 解析 HTTP 
的 便利 。raise_for_status() 方 法 能 在 非 成 功 响 应 后 产生 异常 ， 即 只 要 返回 的 请 求 状态 
status_code 不 是 200， 这 个 方法 会 产生 一 个 异常 ， 用 于 try-except 语句 。 使 用 异常 处 
理 语句 可 以 避免 设置 一 堆 复 杂 的 让 语句 ， 只 需要 在 收 到 响应 时 调用 这 个 方法 ， 就 可 
以 避 开 状态 字 200 以 外 的 各 种 意外 情况 。 

requests 会 产生 几 种 常用 异常 。 当 过 到 网 络 问题 时 ， 如 DNS 查询 失败 、 拒 绝 连 
接 等 ，requests 会 抛 出 ConnectionError 异常 遇 到 无 效 HTTP 响应 时 ，requests 则 会 
抛 出 HITPError 异常 : 若 请 求 url 超时 ， 则 抛 出 Timeout 异常 ， 若 请 求 超过 了 设 定 
的 最 大 重 定向 次 数 ， 则 会 抛 出 一 个 TooManyRedirects 异常 。 

获取 一 个 网 页 内 容 的 函数 建议 采用 如 下 代码 的 第 2 到 第 9 行 ， 第 10 和 第 11 行 
是 测试 代码 。 


1 | import requests 

2 | def getHTMLText() : 

3 try: 

4 r= requests.get{(url, timeout=30) 

5 r.raise for status() # 如 果 状 态 不 是 200， 引 发 异常 
6 r.encoding = 'utE-8' # 无 论 原 来 用 什么 编码 ， 都 改 成 atE-8 
录 return r.text 

8 except: 

9 return "" 

10 | url = "http://www .baidu.com" 

11 | print (getHTMLText (ar1) ) 


丘 展 : HTTP 的 GET 和 POST 


' ”HTTP 协议 定义 了 客户 端 与 服务 器 交互 的 不 同方 法 ,最 基 术 的 方法 是 GET 和 
! POST。 顾 名 思 义 ，GET 可 以 根据 某 链 接 获得 内 容 ，POST 用 于 发 送 内 容 。 然 而 ，， 
' GET 也 可 以 向 链接 提交 内 容 ， 与 POST 的 区 别 如 下 。 

! (1) GET 方式 可 以 通过 URL 提交 数据 ， 待 提交 数据 是 URL 的 一 部 分 ; 采 
! 用 POST 方式 ， 待 提交 数据 放置 在 HTML HEADER 内 。 

! (2) GET 方式 提交 的 数据 最 多 不 超过 1024 字 节 ，POST 没有 对 提交 内 容 的 
' 长 度 限制 。 
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源 代码 10-1 


片 资料 10= 1 


ython 快速 参 


和 之 requests、 
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Be 


: (3) 安全 性 问题 使 用 GET 时 参数 会 显示 在 URL 中 ， 而 POST 不 会 。 所 以 ，， 
| 如 果 这 些 数 据 是 非 敏 感 数 据 ， 那 么 使 用 GET; PR 建议 采 | 
! 用 POST 方式。 ! 


-+ 


思考 与 练习 

10.2 ”请 查阅 资料 更 多 了 解 HTTP 协议 中 post 和 get 功能 的 区 别 和 联系 。 

10.3 ”requests 库 提供 了 一 个 post0 函 数 ， 请 查阅 资料 了 解 该 函数 的 用 法 。 

10.4 请 用 get0 访 问 百度 页 面 ,用 len0 函 数 分 别 计算 text 属性 和 content 属性 所 
返回 网 页 内 容 的 长 度 ， 思 考 产 生长 度 差异 的 原因 。 


10.3 模块 11: beautifulsoup4 库 的 使 用 


”beautifulsoup4 库 是 一 个 解析 和 处 理 HTML [和 和 XML 的 第 三 方 库 . 


10.3.1 ”beautifulsoup4 库 概 述 


使 用 requests 库 获 取 HTML 页 面 并 将 其 转换 成 字符 串 后 ， 需 要 进一步 解析 
HTML 页 面 格式 ， 提 取 有 用 信息 ， 这 需要 处 理 HTML 和 XML 的 函数 库 。 

beautifulsoup4 库 ， 也 称 为 Beautiful Soup 库 或 bs4 库 ， 用 于 解析 和 处 理 HTML 
和 XML。 需 要 注意 的 是 ， 它 不 是 BeautifulSoup 库 。 它 的 最 大 优点 是 能 根据 HTML 
和 XML 语法 建立 解析 树 ， 进 而 高 效 解 析 其 中 的 内 容 。 

HTML 建立 的 Web 页 面 一 般 非 常 复杂 , 除了 有 用 的 内 容 信息 外 ,还 包括 大 量 用 
于 页 面 格式 的 元 素 ， 直 接 解 析 一 个 Web 网 页 需要 深入 了 解 HTML 语法 ， 而 且 比 较 
复杂 。beautifulsoup4 库 将 专业 的 Web 页 面 格式 解析 部 分 封装 成 函数 ， 提 供 了 若干 
有 用 且 便 捷 的 处 理 函 数 。 

beautifulsoup4 库 采 用 面向 对 象 思想 实现 ， 简 单 地 说 ， 它 把 每 个 页 面 当 作 一 个 对 
象 ， 通 过 <a>.<b> 的 方式 调用 对 象 的 属性 〈 即 包含 的 内 容 )， 或 者 通过 <a>.<b>0) 的 方 
式 调 用 方法 〈 即 处 理 函 数 )。 

在 使 用 beautifulsoup4 库 之 前 , 需要 进行 引用 ,由 于 这 个 库 的 名 字 非 常 特殊 且 采 
用 面向 对 象 方式 组 织 ， 可 以 用 from-import 方式 从 库 中 直接 引用 BeautifulSoup 类 ， 
方法 如 下 : 


有 关 beautifulsoup4 库 的 更 多 介绍 请 参考 这 个 第 三 方 库 主页 : http://www.crummy. 
com/software/BeautifulSoup/bs4/。 这 里 主要 介绍 一 些 常用 方法 , 辅助 读者 更 好 理解 本 
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章 后 续 实例 。 


10.3.2 _ beautifulsoup4 库 解 析 


beautifulsoup4 库 中 最 主要 的 是 BeautifulSoup 类 , 每 个 实例 化 的 对 象 相当 于 一 个 
页 面 。 采用 from-import 导入 库 中 的 Beautifulsoup 类 后 ， 使 用 BeautifulSoup() 创 建 一 
个 BeautifulSoup 对 象 。 


创建 的 BeautifulSoup 对 象 是 一 个 树 形 结构 , 它 包 含 HTML 页 面 中 的 每 一 个 Tag 
(标签 ) 元 素 ， 如 <head>、<body> 等 。 具 体 来 说 ，HTML 中 的 主要 结构 都 变 成 了 
BeautifulSoup 对 象 的 一 个 属性 ， 可 以 直接 用 <a>.<b> 形 式 获 得 ， 其 中 <b> 的 名 字 采 用 
HTML 中 标签 的 名 字 。 表 10.4 列 出 了 BeautifulSoup 中 常用 的 一 些 属 性 ， 例 子 如 下 。 


表 10. 4 Would 对 象 的 常用 属性 ( 共 6 二 
串 | “有 二 . ” 描 ) 还 

HTML 页 面 的 <head> 内 容 
HTML 页 面 标题 ， 在 <head> 之 中 ， 由 <title> 标 记 
HTML 页 面 的 <body> 内 容 
HTML 页 面 中 第 一 个 <p> 内 容 
HTML 页 面 所 有 呈现 在 Web 上 的 字符 串 ， 即 标签 的 内 容 
HTML 页 面 所 有 呈现 在 Web 上 的 非 空格 字符 串 


本 二 人 


= i 


BeautifulSoup 属性 与 HTML 的 标签 名 称 相 同 ， 远 不 止 表 10.4 中 的 这 些 ， 更 多 
内 容 请 读者 结合 HTML 语法 理解 。 每 一 个 Tag 标签 在 beautifulsoup4 库 中 也 是 一 个 
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对 象 ， 称 为 Tag 对 象 。 上 例 中 ，title 是 一 个 标签 对 象 。 每 个 标签 对 象 在 HTML 中 都 
有 类 似 的 结构 : 


<a class="mnav" href="http://www.nuomi.com"> 糯 米 </a> 
其 中 ， 尖 括号 〈< 人 >) 中 标签 的 名 字 是 name， 尖 括号 内 其 他 项 是 attrs， 尖 括号 之 间 
的 内 容 是 string。 因 此 ， 可 以 通过 Tag 对 象 的 name、attrs 和 string 属性 获得 相应 
内 容 ， 采 用 <a>.<b> 的 语法 形式 。 标 签 Tag 有 4 个 常用 属性 ， 如 表 10.5 所 示 ， 例 子 
如 下 。 


表 10.5 标签 对 象 的 常用 属性 (a 4 这 


i 


J 


name 字符 串 ， 标签 的 名 字 ， 比 Tr 

字典 ， 包 含 了 原来 页 面 Tag 所 有 的 属性 ， ein href 
列表 ， 这 个 Tag 下 所 有 子 Tag 的 内 容 
string 字符 串 ，Tag 所 包围 的 文本 ， 网 页 中 真实 的 文字 


attrs 
contents 


由 于 HTML 语法 可 以 在 标签 中 嵌 套 其 他 标签 ， 所 以 ，string 属性 的 返回 值 遵 循 
如 下 原则 。 

(1) 如 果 标 签 内 部 没有 其 他 标签 ，string 属性 返回 其 中 的 内 容 。 

(2) 如 果 标 签 内 部 还 有 其 他 标签 ， 但 只 有 一 个 标签 ，string 属性 返回 最 里 面 标 
签 的 内 容 。 

(3) 如 果 标 签 内 部 有 超过 1 层 撕 套 的 标签 ，string 属性 返回 None 〈 空 字符 串 )。 

HTML 语法 中 同一 个 标签 会 有 很 多 内 容 , 例如 <a> 标 签 , 百度 首页 一 共有 13 处 ， 
列表 如 下 ， 直 接 调 用 soup.a 只 能 返回 第 一 个 。 

<a class="mnav" href="http://www.nucmi .com"> 精 米 </a> 

<a class="mnav" href="http://news.baidu.com"> 新 闻 </a> 

<a class="mnav" href="http://www.haol23.com">haocol23</a> 
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<a class="mnav" href="http://map.baidu.com"> 地 图 </a> 

<a class="mnav"” href="http://v.baidu.com"> 视 频 </a> … 

当 需 要 列 出 标签 对 应 的 所 有 内 容 或 者 需要 找到 非 第 一 个 标签 时 ， 需 要 用 到 
BeautifulSoup 的 find0 和 find_all( 方 法 。 这 两 个 方法 会 遍历 整个 HTML 文档 ， 按 照 
条 件 返 回 标签 内 容 。 


BeautifulSoup.find all(name, attrs, recursive, string, limit) 
作用 : 根据 参数 找到 对 应 标签 ， 返 回 列表 类 型 。 

参数 如 下 。 

name: 按照 Tag 标签 名 字 检 索 ， 名 字 用 字符 串 形式 表示 ， 例 如 div、1i。 
attrs: 按照 Tag 标签 属性 值 检 索 ， 需 要 列 出 属性 名 称 和 值 ， 采 用 JSON 表示 。 
recursive: 设置 查找 层次 ， 只 查找 当前 标签 下 一 层 时 使 用 recursive=False。 
string: 按照 关键 字 检 索 string 属性 内 容 ， 采 用 string= 开 始 。 

Limit: 返回 结果 的 个 数 ， 默 认 返 回 全 部 结果 。 


简单 地 说 ，BeautifulSoup 的 find_all0 方 法 可 以 根据 标签 名 字 、 标 签 属性 和 内 容 
检索 并 返回 标签 列表 ,通过 片段 字符 串 检 索 时 需要 使 用 正则 表达 式 re 函数 库 , re 是 
Python 标准 库 ， 直 接 通 过 import re 即 可 使 用 。 采 用 re.compile('jquery") 实 现 对 片段 
字符 串 (如 'jquery') 的 检索 。 当 对 标签 属性 检索 时 ， 属 性 和 对 应 的 值 采 用 JSON 
格式 ， 例 如 : 

'src':re.compile('jquery') 


其 中 ， 键 值 对 中 值 的 部 分 可 以 是 字符 串 或 者 正则 表达 式 。 


局 开 正则 表达 式 
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, 则 所 有 包含 该 表达 式 的 字符 囊 都 与 它 匹配 。 除 了 字符 串 ， 正 则 表达 式 还 可 以 通过 ， 
， *+{} 等 符号 扩展 功能 .有 兴趣 的 读者 可 以 查阅 资料 了 解 Python 中 正则 表达 式 函 数 ， 
! 库 re 的 更 多 高 级 使 用 。 


< 二 


除了 find_all0 方 法 ，BeautifulSoup 类 还 提供 一 个 find() 方 法 ， 它 们 的 区 别 只 是 
前 者 返回 全 部 结果 而 后 者 返回 找到 的 第 一 个 结果 ，find_all0 函 数 由 于 可 能 返回 更 多 
结果 ， 所 以 采用 列表 形式 ，findO) 函 数 返回 字符 串 形式 。 

BeautifulSoup.find(name, attrs, recursive, string) 

作用 : 根据 参数 找到 对 应 标签 ， 采用 字符 串 返 回 找到 的 第 一 个 值 。 

参数 : 与 fnd_all(0 方 法 一 样 ， 略 。 

处 理 网 页 需要 对 HTML 有 一 定 的 理解 ,然而 实现 息 虫 并 不 算 复 杂 ;， 这 里 仅 介绍 
beautifulsoup4 库 中 与 疏 虫 相关 的 一 些 属性 和 操作 .beautifulsoup4 库 是 一 个 非常 
且 活跃 的 HTML 解析 函数 库 ， 它 还 可 以 完成 更 多 复杂 操作 。 深入 使 用 请 阅读 
beautifulsoup4 库 官 方 网 站 上 提供 的 使 用 文档 。 


思考 与 练习 
10.5 下列 不 属于 HTML 的 Tag 的 是 ( 
A,. title B. a CGC. elass D. head 
10.6 这 是 一 个 简单 的 HTML 页 面 ， 请 保存 为 字符 串 ， 完 成 后 面 的 计算 要 求 。 
<html> 
<head> 
<title>Simple test</title> 
</head> 
<body> 
<p id="China"> 中 国 ，<b> 你 好 ! </b>。 </p> 
<p id="World"> 世 界 ，<b> 大 同 ! </b>。 </p> 
</body> 
</html> 
(1) 打印 head 标签 的 内 容 。 
(2) 获取 body 标签 的 内 容 。 
(3) 获取 id 为 China 的 标签 对 象 。 
(4) 获取 并 打印 HTML 页 面 中 的 中 文字 符 。 


10.4 实例 20: 中 国 大 学 排名 把 虫 


要 点 5 这 是 一 个 获取 中 国 大 学 排名 的 殷 虫 实例 ， 采 用 了 requests 和 和 | 


beautifulsoup4 函数 库 。 | 
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“有 人 的 地 方 就 有 江湖 ” 有 大 学 的 地 方 就 有 排名 。 尽 管 中 国 大 学 排名 不 能 客观 
反映 各 高 校 的 绝对 实力 和 影响 力 ， 但 也 能 反映 大 学 间 的 相对 关系 。 

全 球 有 很 多 份 大 学 排名 ， 这 里 以 上 海 交 通 大 学 研发 的 “ 软 科 中 国 最 好 大 学 排名 
2016” 为 例 ， 编 号“ 大 学 排名 爬虫 ” 如 图 10.1 所 示 ， 从 网 络 上 获取 数据 ， 这 个 大 
学 排名 网 址 为 http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html。 拟 从 该 网 址 
有 息 取 该 名 单 上 310 所 国内 大 学 的 排名 数据 ， 并 将 它们 打印 出 来 。 读 者 可 以 对 这 些 数 
据 开 展 其 他 操作 。 


图 10.1 软 科 中 国 大 学 排名 2016 网 页 片段 


大 学 排名 息 虫 的 构建 需要 3 个 步骤 : 第 一 ， 从 网 络 上 获取 网 页 内 容 ; 第 二 ， 分 
析 网 页 内 容 并 提取 有 用 数据 到 恰当 的 数据 结构 中 ; 第 三 ， 利 用 数据 结构 展示 或 进 一 
步 处 理 数据 。 由 于 大 学 排名 是 一 个 典型 的 二 维 数 据 ， 因 此 ， 结 合 7.4 节 介 绍 ， 采 用 
二 维 列表 存储 该 排名 所 涉及 的 表单 数据 。 

具体 来 说 ,采用 requests 库 疏 取 网 页 内 容 ， 使 用 beautifulsoup4 库 分 析 网 页 中 的 
数据 ， 提 取 310 个 学 校 的 排名 及 相关 数据 ， 存 储 到 二 维 列表 中 ， 最 后 采用 用 户 偏好 
的 方式 打印 出 来 。 

为 了 解析 网 页 上 的 数据 ， 首 先 需 要 程序 编写 者 观察 仆 虫 页 面 的 特点 ， 即 找到 拟 
获取 数据 在 HTML 页 面 中 的 格式 。 打 开 大 学 排名 页 面 ， 在 浏览 器 菜单 中 选择 “查看 
网 页 源 代码 ”命令 ,该 选项 在 所 有 浏览 器 中 都 存在 , 得 到 的 HTML 源 代码 如 图 10.2 
所 示 ( 为 了 便于 阅读 ， 该 源 代码 做 过 一 定 排版 )。 

对 比 图 10.1 和 图 10.2， 每 个 大 学 排名 的 数据 信息 被 封装 在 一 个 <tr></tr> 之 间 的 
结构 中 。 这 是 HTML 语言 表示 表格 中 一 行 的 标签 , 在 这 行 中 ,每 列 内 容 采 用 <td></td> 
表示 。 以 “清华 大 学 ”为 例 ， 它 对 应 一 行 信息 的 HTML 代码 如 下 : 
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<rbody class="hidden xhpa" sryle="text-align:oenter;"> 
<tr class="alt"> 
<rdy1i</tdy<rd><div align="left"y 清 华 大 学 </div></td> <td> 北 京 市 </td><rd>95.9¢</tdy<rd class="hidden-xs need-hidden 
indicator5">100,0</td><rd classg="hidden-xs necd-hidden indicatoré" sryle="display:none:">97.90%</td><td class= 


“hidden-_xs necd-hidden indicator7T aryie="display:none;">37342¢</td><rd class="hidden-xs need-hidden indicatorS" 
style="display:none:">1,298</td><td class="hidden-xs need-hidden indicator9" style="display:none;">1177¢/td><td 
clase="hidden-xs need-hidden indicatorl0" sryle="display:none:">109</td><td class="hidden-xs need-hidden 
tindicatoril"” svyle="display:none;">1137711</td><rd class="hidden-xs need-hidden indicator1i2" sryle="display:none;" 
>1187</tdy<td class="hidden-xs need-hidden indicatori3" style="display:none;:">593522¢</td> 

</tr> 2 

<tr> 
<zd>2</tdycrd>cdiv align="left"> 北 京 大 学 </div></rta> <rd> 北 京 市 </td><td>82.6</td><td class="hidden-xs need-hidden 
indicator5">98.9</td><td class="hidden-xs need-hidden indicatoré" sryle="display:none;">95.96%/rd>crd class= 
"hidden-xzs need-hidden indicator7” style="display:none;">361371¢/tdo<rd class="hidden-xs meed-hidden indicatorg™ 
=ryle="display:none;">1.294</td><td clnss="hidden-xs noed-hidden indicator9" style="display:none;">986¢</td><td 
class="hidden-xs need-hidden indicator10" scy¥le="display:none;">87</td><rd class="hidden-xs need-hidden 
indioatoril" style="display:none;">%439403</tdy<rd ciass="hidden-xs necd-hidden indicatori2" style="display:none;"> 
T99</td><rd class="hidden-xs necd-hidden indicatorl3" sryle="display:none;">7343</trd> 

</Irr> 

发 CI class="alt"> 
<zd>3c/bd><tdycdiv align=vleft"> 浙 江 大 学 c/divy<ytd> ctrd> 浙 江 省 </tdy<td>80</td><td class=nhidden-xs need-hidden 
indicator5">88.98</td><td ciass="hidden~xs need-hidden indicator6" style="display :none;">96.46%</rdy<rd class= 
"hidden-xs need-hidden indicator7" styile="display:none;">41188</rd><rd ciass="hidden-xs need-hidden indicatore" 
sryle="display:none;">1.059</tdr<rd class="hidden-xs neced-hidden tndicator9” sryle="display:none;">803</td><rd 
ciass="hidden-xs need-hidden tndicatorl0" style="display:none:">86¢/td><rd class="hidden-xs need-hidden 
indiocatorll" sryle="display:none;">959511</td><rd class="hidden-xs need-hidden indicatori2" sryle="display:none;"> 
B33</rdycrd class="hidden-xs necd-bidden indicator1l3" sryle="display:none;">64392</td> 

</tr> 


图 10.2 软 科 中 国 大 学 排名 2016 网 页 HTML 源 代 码 片 段 


代码 中 每 个 td 标签 包含 大 学 排名 表格 的 一 个 列 数值 ， 与 表 头 一 一 对 应 。 因 此 ， 
如 果 要 获得 其 中 的 数据 ， 需 要 首先 找到 <tr></tr> 标 签 ， 并 遍历 其 中 每 个 <td></td> 标 
签 ， 获 取 其 值 写 入 程序 的 数据 结构 中 ， 这 个 代码 封装 成 函数 表示 如 下 ， 


1 | allUniv=[] # 存 储 全 部 表格 数据 ， 二 维 列表 
2 | def fillUnivList(soup): 


3 data = soup.find all('tr') # 找 到 所 有 tr 标签 
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for tr in data: 

singleUniv = [] 

ltd = tr.find all('td') # 在 每 个 tz 标签 中 找到 所 有 td 标签 
| for td in ltd: 

singleUniv.apPend(td.string) # 提 取 td 标签 中 的 信息 
allUniv.apPend(singleUniv) data 


‘oO A OU 心 


上 述 逻 辑 尽 管 不 错 ， 却 不 完全 。HTML 页 面 中 除了 显示 大 学 排名 的 地 方 ， 其 他 
位 置 也 可 能 有 表格 和 <tr></tr> 标 签 ， 应 该 尽量 剔除 这 种 情况 。 由 于 疏 虫 针对 特定 网 
页 ， 程 序 编写 也 不 必 考 虑 所 有 情况 ， 只 要 能 应 对 当前 页 面 即 可 。 在 这 个 大 学 排名 页 
面 中 ， 还 有 一 处 用 到 了 表格 ， 包 含 <tr> 标 签 ， 但 这 个 标签 内 部 不 包括 <td> 标 签 。 因 
此 ， 可 以 通过 增加 一 个 判断 语句 剔除 这 种 情况 ， 观 察 下 面 代码 的 第 6 行 和 第 7 行 。 


1 | allUniv=[] # 存 储 全 部 表格 数据 ， 二 维 列表 

2 def fillUnivList(soup): 

3 data = soup.find all('tr') # 找 到 所 有 tr 标签 

4 for tr in data: 

5 ltd = tr.find all('td') # 在 每 个 tr 标签 中 找到 所 有 td 标签 
6 if len(ltd)==0: 

y continue 

8 singleUniv = [] 

9 for td in ltad: 

10 singleUniv.append (td.string) # 提 取 td 标签 中 的 信息 
11 allUniv.append (singleUniv) 


除了 增加 两 行 代码 外 ， 请 将 原 函 数 的 第 5 行 调整 为 第 8 行 ，singleUniv=[] 语 句 
真实 创建 了 一 个 空 列表 对 象 ， 它 用 于 存储 当前 <tr> 标 签 表 示 大 学 的 数据 。 如 果 第 6 
行 让 语句 条 件 成 立 ， 说 明 当 前 读 取 的 标签 内 容 不 是 大 学 数据 ， 如 果 创 建 了 空 列表 将 
不 再 有 用 。 因 此 ， 该 语句 调整 到 让 语 名 后， 只 有 在 让 语 句 判断 该 <tr> 标 签 表 示 大 学 
数据 时 才 生 成 空 列表 ， 这 样 编写 代码 有 利用 占用 更 少 的 内 存 。 

也 许 在 其 他 HTML 页 面 中 会 出 现 更 多 需要 剔除 的 情况 , 而 在 这 个 大 学 排名 网 页 
中 ， 仅 需要 剔除 一 种 情况 就 能 准确 获得 数据 。 大 学 排名 聆 虫 完 整 源 代码 如 下 : 


实例 代码 20.1 代码 文件 名 e20.1CrawUnivRanking.py 


#e24 .1CrawUnivRanking.PY 
import requests 
from bs4 import BeautifulSoup 
allUniv = [] 
def getHTMLText (url): 
try: 
r= requests.get(url, timeout=30) 


J OO bp 
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r.raise for status() 
r.encoding = 'utf-8' 


10 return r.text 

Ll except: 

12 return "" 

13 | def fillUnivList(soup): 

14 data = soup.find alll('tr') 

LS for tr in data: 

16 ltd = tr.find all('td') 

by: if len (1td) ==0 : 

18 continue 

19 singleUniv = [] 

20 for td in ltad: 

21 singleUniv.append (td.string) 

至 2 allUniv.append (singleUniv) 

23 | def printUnivList (num): 

24 print("{:^4}{:^10}{:^5}{:^8)}{:^10}" .format ("排名 ",\ 
"学 校 名 称 " "省 市 " "总 分 ", "培养 规模 ") ) 

25 for i in range (num): 

26 u=allUniv[i] 

27 print("™{t: *a}1:*10}{:^S}IS*8{: S110" £0ormat tul0l] ;\ 


u[1] ,u[2] ,u[3],u[6])) 
28 | def main (num) : 


29 url = 'http://www.zuihaodaxue.cn/\ 
zuihaodaxuepaiming2016.html' 

30 html = getHTMLText (url) 

3. soup = BeautifulSoup(html, "html .parser") 

32 fillUnivList(soup) 

33 printUnivList (num) 


34 | main(10) 


实例 代码 20.1 运行 结果 如 下 : 
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尽管 实例 代码 20.1 完成 了 中 国 大 学 排名 疏 虫 功能 ， 但 输出 效果 却 不 尽 人 意 ， 各 
列 内 容 并 没有 对 齐 。 这 是 因为 中 文 和 数字 字符 占用 的 宽度 不 同 ， 利 用 format( 方 法 
中 的 {:N} 方 式 只 是 约定 了 输出 某 个 变量 占用 的 字符 个 数 ， 而 没有 实际 上 约束 占用 的 
字符 宽度 。 这 是 中 文 和 西 文字 符 混 排 输出 时 经 常 遇 到 的 问题 。 西 文字 符 占用 一 个 位 
置 宽度 ， 而 中 文字 符 占 用 多 个 位 置 宽度 。 

实例 20 输出 的 每 一 列 都 有 显著 的 类 型 特点 ,或 者 全 是 中 文字 符 ,或 者 全 是 数字 。 
对 于 这 类 混 排 对 齐 问 题 ， 可 以 从 填充 字符 角度 考虑 解决 。 以 输出 的 第 2 列 为 例 ， 实 
例 代码 20.1 中 第 20 和 第 27 行 约定 “学 校 名 称 ” 列 占用 10 个 字符 ， 当 中 文 是 4 个 
字符 时 (如 “清华 大 学 ”)， 其 他 6 个 字符 采用 西 文 空格 填充 ， 当 中 文 是 6 个 字符 时 
(如 “上 海 交 通 大 学 ”),， 其 他 4 个 字符 采用 西 文 空格 填充 。 但 由 于 中 文 和 西 文字 符 占 
用 的 位 置 宽度 不 同 ， 造 成 了 输出 不 能 对 齐 的 问题 。 


24 | print("{:^4}{:~^10}{:^5}{:^8}{:^10}".format(" 排 名",\ 
"学 校 名 称 "," 省 市 ", "总 分 "， "培养 规模 ") ) 
27 | print("{:^4}{:^10}{:^5}{:^8}{:^10}" .format (ul0];,\ 
u[1] ,ul2] ,u[3] ,u[6])) 


解决 该 问题 一 个 简单 的 方法 是 替换 填充 字符 ， 采 用 “中 文 全 角 空 格 ” 代 替 默 认 
使 用 的 “ 西 文 半角 空格 ”这 能 够 对 齐 中 文字 符 出 现 的 列 。 修 改 后 的 printUnivListO 
函数 代码 如 下 ， 请 用 该 代码 替换 实例 代码 20.1 中 的 printUnivListO 函 数 。 


1 | def printUnivList (num): 


2 print("{1:^2}{2:{0}^10}{3:{0}^6}{4:{0}^4}{5:{0}^10}".format 
\ (chr (12288)," 排 名", "学 校 名 称 "," 省 市 ", "总 分 ", "培养 规模 ") ) 

3 for i in range (num) : 

4 u = allUniv[i] 

5 Print("{1:^4}{2:{0}^10}{3: {0}^5}{4:{0}^8.1£}{5: {0}^10}". 


\format (chr (12288) ,u[0] ,u[1] ,u[2] ,eval (u[3]) ,u[6])) 


上 述 函 数 中 ， 中 文 全 角 空 格 采用 chr(12288) 表 示 ，format0 函 数 在 标题 栏 和 每 行 
输出 的 参数 经 过 手工 调整 。 程 序 修改 后 运行 输出 效果 如 下 : 
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A 
| 蕉 和 招生 有 非常 深远 的 影响 ， 大 学 排名 逐渐 成 为 一 个 产业 。 当 前 几 大 主流 世界 大 ， 
, 学 排名 分 别 为 英国 《泰晤士 高 等 教育 》 杂 志 THE 世界 大 学 排名 、 英 国 QS 世界 大 ; 
' 学 排名 、 美 国 USNEWS 世界 大 学 排名 、 荷 兰 菜 顿 大 学 世界 大 学 排名 、 上 海 交通 ， 
' 大 学 软 科 世界 大 学 排名 。 | 
: 一 一 这 么 多 排名 ， 该 相信 哪 一 个 ? Ho 
1 一 角度 不 同 、 侧 重 不 同 、 结 果 不 同 。 要 不 写 个 息 虫 抓 回 数 据 取 个 平均 数 ? 


= a= 


1 
4 
1 
1 
1 
1 
U 
1 
1 


思考 与 练习 
10.7 思考 实例 代码 20.1 还 可 能 有 哪些 改进 。 
10.8 ”修改 代码 输出 排名 后 50 位 的 大 学 。 
10.9 修改 代码 输出 某 个 省 份 的 大 学 排名 。 


10.5 实例 21: 搜索 关键 词 自动 提交 


这 是 一 个 向 搜索 引擎 自 动 提交 检索 关键 词 并 获取 返回 结果 的 实例 。 | 


搜索 引擎 是 日 常 工作 常用 的 工具 ， 也 是 访问 互联 网 的 门户 。 有 时 候 需 要 自动 向 
搜索 引擎 提交 关键 字 并 获得 查询 结果 。 本 节 以 百度 为 例 介 绍 搜索 关键 字 自 动 提 交 并 
获得 返回 结果 的 方法 。 

百度 搜索 引擎 首页 为 http:/www.baidu.com， 当 输入 一 个 待 查询 关键 词 keyword 
时 ， 百 度 程序 将 这 个 查询 自动 转换 为 链接 : http:/www.baidu.com/s?wd=keyword。 读 
者 可 以 在 浏览 器 上 手工 输入 这 个 链接 ， 将 keyword 换 成 任意 想 查询 的 关键 字 ， 都 能 
获得 查询 结果 。 

利用 百度 搜索 提供 的 这 个 链接 接口 ， 可 以 通过 requests 的 get0 函 数 提交 查询 ， 
啊 应 结果 为 百度 搜索 结果 。 这 个 问题 的 IPO 描述 如 下 。 

输入 : 待 查询 关键 字 

处 理 : 自动 获得 百度 搜索 结果 页 面 ， 并 对 页 面 内 容 解析 处 理 

输出 : 返回 链接 的 标题 列表 

参考 实例 20 的 过 程 ， 首 先 人 工分 析 百 度 查 询 结果 页 面 HTML 代码 ， 部 分 片段 
如 图 10.3 所 示 。 由 于 这 些 HTML 代码 由 机 器 自动 生成 ， 可 读 性 较 差 ， 需 要 读者 对 
比 网 页 上 的 搜索 结果 和 代码 仔细 寻找 。 
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>《<em> 程 序 设计 基础 (Python 语言 )</emy 山 天 , 黄 天 羽 , 礼 欣 高 等 教育 出 ..， 京东 </a></h3>cdiv cisss="o-abstract">cspan class=" 
bewTimeEactor before_abs mm">2014 年 7 月 1 日 snpsp:-snpsp:</span>《<em> 程 序 设 i (Python 语言 )<yem> 
》 系统 地 介绍 了 pyrtnon 程 序 设计 语言 和 程序 设计 的 基本 方法 。 从 <=m>Python 语 言 </em> 发 展 历史 、 配 置 环 境 开 始 , 详细 介 绍 了 Pytnon 语 言 


</jdivy<div class="f1l3"><a ea biank" href=" 


RZp" claess="o-showuri" style= 
112877157528_2" 


GPBASA1S204B5DA2%D 
Target™" blank” Larget=" 3 blank” 
ee 本 详 潜 中 sjespen Class="oO- pingdia" Yh i <a href=" 


DO OD A A CLD NN A i A 
图 10.3 百度 查询 结果 页 面 HTML 代码 片段 
经 过 分 析 发 现 ， 页 面 上 返回 结果 标题 被 封装 在 如 下 结构 中 : 


<div'“data-tools= "(Etle" DD Mrl en) rye /divS 
利用 beautifulsoup4 库 找到 data-tools 属性 值 ， 提 取 带 有 title 的 字符 串 ， 可 以 看 
到 ，data-tools 内 部 由 人 形成 的 数据 是 典型 的 JSON 格式 ， 可 以 用 json 库 将 其 转换 成 
字典 ， 便 于 操作 。 
实例 代码 21.1 给 出 了 完整 的 搜索 关键 词 自动 提交 程序 。 


实例 代码 21.1 e21.1AutoKeywordSearch.py 

1 #e25.1AutoKeywordSearch.py 

忆 import requests 

本 from bs4 import BeautifulSoup 

4 import re 

3 import json 

6 def getKeywordResult (keyword): 

多 url = 'http://www.baidu.com/s?wd='+keyword 

8 try: 

9 r= requests.get(url, timeout=30) 

10 r.raise for status () 

14 r.encoding = 'utf-8' 

二 去 return r.text 

13 except: 

14 return "" 

15 | def parserLinks (html): 

16 soup = BeautifulSoup(html, "html .parser") 

17 links = [] 

18 for div in soup.find alll('div', {'data-tools':\ 
re.compile('title')}): 

19 data = div.attrs['data-tools'] # 获 得 属性 值 

20 d = json.loads (data) # 将 属性 值 转换 成 字典 

有 3 links.append(d['title']) # 将 返回 链接 的 题目 返回 

之 分 return links 

23 | def main() : 
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24 html = getKeywordResult('Python 语言 程序 设计 基础 (第 2 版 ) ') 


入 多 ls = parserLinks (html) 

26 count = 1 

之 7 Eo TL 1 TB: 

28 print("[{:^3}]{}".format (count, i)) 
29 count += 1 


30 | main() 


人 
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图 404 CAPTCHA 验证 码 东 例 ” 2 


CAFTCRN Muon Lt on 
; 难 识别 的 信息 ， 反 馈 信 息 与 生成 验证 码 的 真实 信息 对 比 能 够 判断 输入 反馈 的 “用 
we 是 程序 还 是 人 类 。 CAPTCHA 验证 码 已 经 成 为 现代 网 络 服务 系统 的 标准 配置 
在 技术 层面 ， 除 了 搜索 引擎， 还 可 以 向 其 他 可 以 查询 数据 信息 的 网 页 提交 查询 
关键 词 。 正 是 因为 有 这 类 自动 提交 程序 ， 当 今 开 发 的 服务 网 站 不 得 不 增加 图 片 或 声 
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音 类 型 的 验证 码 ， 用 来 区 分 用 户 是 计算 机 的 自动 程序 还 是 人 。 技 术 是 反映 人 类 思想 
的 手段 ， 掌 握 了 所 谓 “ 更 有 能 力 ” 和 “更 先进 ”的 技术 没什么 大 不 了 ， 最 为 可 贵 的 
是 去 思考 如 何 通 过 技术 手段 为 人 类 和 世界 带 来 更 美好 的 未 来 。 


能 力 越 大 、 责 任 越 大 。 (第 一 季 , 终 ) 
思考 与 练习 

10.10 仔细 观察 百度 搜索 返回 页 面 的 HTML 代码 ， 找 到 右 侧 “ 相 关 术语 ”部 
分 对 应 的 代码 。 


10.11 仔细 观察 并 解释 百度 图 片 搜 索 页 面 的 HTML 代码 。 


本 章 小 结 


本 章 主 要 介绍 了 设计 并 实现 网 络 息 虫 的 基本 方法 ， 结 合 requests 和 
beautifulsoup4 两 个 库 的 使 用 ， 讲 述 了 如 何 处 理 HTTP 协议 以 及 解析 网 页 HTML 和 
XML 页 面 信息 的 方法 。 本 章 通过 中 国 大 学 排名 息 虫 和 搜索 关键 词 提 交 两 个 实例 , 展 
示 了 现代 网 络 社会 中 快速 抓 取 定 向 网 页 数据 的 重要 价值 。 


程序 练习 题 


10.1 参考 实例 24， 实 现 按 照 省 份 输出 中 国 大 学 排名 的 功能 。 

10.2 参考 实例 24， 实 现 USNEWS 美国 大 学 排名 的 息 虫 ， 并 打印 结果 。 

10.3 ”编写 视频 网 站 视频 播放 链接 的 仆 虫 。 

10.4 编写 爬 取 robots.txt 文件 的 仆 虫 ， 并 分 析 有 候 取 的 内 容 。 

10.5 编写 根据 robots.txt 文件 内 容 疏 取 网 站 的 程序 。 

10.6 “分析 百度 图 片 搜索 返回 结果 的 HTML 代码 ， 编 写 疏 虫 抓 取 图 片 并 下 载 形 
成 专题 图 片 库 。 

10.7 编写 程序 测量 30 秒 内 成 功 获得 百度 主页 的 次 数 。 


Gt 
程序 练习 10-1， | 
章节 程序 练习 题 
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附录 A 极 简 计算 机 基础 


一 个 序 纸 、 笔 、 克 尺 胡 洲 有 重 宅 村 下 衣 打 为 凑 旭 人， 不 质 上 放 起 一 症 亿 人 导 湛 轴 。 
A man provided with paper, pencil, and rubber, and subject to strict discipline, is in 
effect a universal machine. 
艾 伦 ， 图 灵 (Alan Turing) 
计算 机 科学 之 父 、 人 工 智 能 之 父 、 数 学 家 


(1) 了 解 基本 的 数值 和 数据 概念 。 
(2) 了解 计算 机 硬件 平台 的 组 成 。 
(3) 了 解 计算 机 软件 平台 的 组 成 。 
(4) 了 解 Internet 和 WWW 的 历史 。 
(5) 了 解 常用 的 Python 编辑 器 。 


人 
+ ] 


计算 机 已 经 不 是 什么 新 鲜 事 物 ， 计 算 机 基础 知识 到 处 都 可 以 找到 ， 哪 有 时 间 看 
接 下 来 的 内 容 ? 作者 只 能 冷笑 。 尽 管 计算 机 知识 哪里 都 有 ， 以 计算 机 基础 为 故事 情 
节 的 内 容 却 独 此 一 家 。 从 01 表示 到 大 数据 、 从 开关 电路 到 GPU 逆 袭 、 从 汇编 指令 
到 云 平台 虚拟 化 ， 这 些 不 只 是 概念 堆砌 ， 更 有 内 在 的 逻辑 情节 。 

不 看 会 后 悔 ， 看 了 更 后 悔 ， 为 何 没 早点 儿 看 ? ! 
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A.1 数值 和 数据 


二 进 制 是 仅 由 0 和 1 组 成 的 进位 和 运算 逻辑 ， 运 算 关 系 如 下 : 

0+0=0, 0+1=1, 1+0=0, 1+1=10 

二 进 制 中 , 单个 0 或 1 称 为 比特 (bit, 简称 b),8 个 0 或 1 的 组 合 称 为 字 节 (Byte， 
简称 B)，1 个 字 节 是 8 个 比特 。 

由 于 基本 电路 一 般 包 括 两 种 状态 : 高 电 平 或 低 电 平 、 接 通 或 断 开 ， 所 以 ， 为 了 
适应 并 高 效 利 用 基于 这 种 电路 计算 装置 ， 计 算 机 内 部 采用 二 进 制 表示 数据 并 采用 二 
进 制 运算 进行 数据 计算 。 

编程 语言 中 的 整数 、 浮 点 数 、 字 符 串 、 列 表 和 字典 等 所 有 数据 类 型 在 计算 机 内 
部 都 采用 二 进 制 表示 。 列 表 和 字典 这 类 组 合 数据 类 型 由 基本 数据 类 型 组 合 而 成 ， 整 
数 、 浮 点 数 和 字符 这 些 基 本 数据 类 型 需要 计算 机 直接 表示 、 存 储 和 计算 。 整 数 采 用 
整数 的 二 进 制 形式 存储 在 计算 机 中 ， 整 数 的 加 减 乘 除 运 算 采 用 二 进 制 形 式 计算 ， 然 
后 将 结果 转换 成 十 进 制 或 其 他 进 制 反馈 给 用 户 。 浮 点 数 采 用 国际 通用 的 浮 点 数 算 术 
标准 (IEEE 754) 表示 ， 该 标准 规定 了 计算 机 如 何 利用 二 进 制 表示 小 数 以 及 开展 计 
算 的 方法 。 字 符 通 过 如 ASCII、UTF-8 等 编码 形式 由 一 个 或 多 个 字 节 表示 ， 一 个 字 
节 由 8 个 比特 表示 。 

实际 生活 中 ， 除 了 二 进 制 、 十 进 制 外 ， 还 有 很 多 进 制 方式 ， 例 如 ， 一 周 7 天 是 
七 进 制 ， 一 天 24 小 时 是 二 十 四 进 制 ， 一 小 时 60 分 钟 是 六 十 进 制 。 由 于 二 进 制 是 计 
算 机 采用 的 运算 逻辑 ， 因 此 ， 编 程 中 常用 二 进 制 、 八 进 制 、 十 六 进 制 和 人 类 熟悉 的 
十 进 制 。 对 于 计算 机 来 说 ， 其 内 部 对 数据 的 表示 和 运算 始终 都 是 二 进 制 ， 其 他 进 制 
只 是 展示 不 同 ， 原 则 上 不 需要 用 户 人 工 进 行进 制 转换 。 

十 进 制 数 最 为 常用 ， 它 使 用 10 个 数字 符号 表示 ， 每 一 位 只 能 使 用 0、1、2、3、 
4、5、6、7、8、9 这 10 个 符号 中 的 一 个 ， 十 进 制 数 采 用 “着 十 进 一 ” 的 进位 方法 。 

八进制 使 用 8 个 数字 符号 表示 ， 每 一 位 只 能 使 用 0、1、2、3、4、5、6、7 这 8 
个 符号 中 的 一 个 ， 八 进 制 数 采用 “着 八 进 一 ”的 进位 方法 。 

十 六 进 制 使 用 16 个 字符 符号 表示 ， 除 了 数字 0 到 9， 额 外 采用 A~E 这 6 个 字 
符 ， 即 每 一 位 只 能 使 用 0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F 这 
16 个 符号 中 的 一 个 ， 其 中 ，A 表示 十 进 制 的 10，F 表示 十 进 制 的 135， 只 是 由 于 十 
六 进 制 的 每 个 位 置 只 能 用 一 个 符号 表示 ， 所 以 ， 创 造 性 的 使 用 了 _A 一 F。 由 于 字母 
字符 A~F 存在 大 小 写 两 种 形式 ， 所 以 ， 小 写 a~f 也 可 以 用 于 十 六 进 制 ， 与 大 写字 
符 含义 相同 。 十 六 进 制 数 采用 “着 十 六 进 一 ” 的 进位 方法 。 

解决 了 基本 的 数字 表示 问题 ， 计 算 机 遇 到 了 字符 表示 问题 。 西 文字 符 包 括 英文 
字母 、 数 字 和 各 种 控制 符号 组 成 ， 总 共 才 100 多 个 ， 使 用 一 个 字 节 (8 bit) 即 可 表 
示 。 因 此 ， 计 算 机 对 于 西 文字 符 一 般 采 用 美国 标准 交换 代码 (ASCII) 表示 ，ASCII 
编码 是 一 种 制定 于 1967 年 的 编码 标准 ， 能 很 好 地 解决 西 文字 符 的 定义 和 表示 问题 。 
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ASCII 编码 共 包 含 128 个 字符 ， 包 括 26 个 英文 字母 的 大 小 写 符号 及 标点 符号 、 
专用 符号 及 控制 符 〈 如 回 车 、 换 行 、 响 铃 等 )。 由 于 总 数 没有 超过 128， 所 以 ASCII 
码 采 用 7 位 二 进 制 编码 , 如 附 表 A.1 所 示 。 其中, 前 32 个 通用 控制 符 不 能 打印 和 显示 ， 
后 96 个 是 可 以 显示 和 打印 出 来 的 字符 。 通 用 控制 符 的 意义 或 动作 如 附 表 A.2 所 示 。 


附 表 A.1 ASCII 码 
bebsba > ; : np 本 
EE: 
0000 |NUL |pmEr | s | 0 |@ | PP | | 
o10 |EOT |pc | s | 4 |p | 7 | ad | 
0101 | ENQ % | | | ee | 
wo | TY law | 3 | % | T | TT | % | 
Tr 央 天 到 古本 本 到 配 
uo |cR [os | - | = M ] } 
附 表 A.2 ”ASCII 码 中 通用 控制 符 的 意义 或 动作 
符号 意义 或 动作 
NUL 窑 | FF | 走 纸 控制 | ETB | 信息 组 传送 束 
SOH 标题 开始 | CR | 回 车 | caAN | 作废 
STX | 正文 开始 | SO 。 | 移 位 输出 | EM | 纸 尽 
EXT | 正文 结束 | st | 移 位 输入 | suB | 减 
EOT | 传输 结束 ”| SP | 空格 | ESC | 换 厅 
ENQ 一 一 一 一 文字 分 隔 符 
ACK | 承认 组 分 隔 符 
BEL | 。 响 铃 警 报 | DC2 |[ 设备 控制 2 | RS | 记录 分 隔 符 
BS | 退 - 格 [| pc3 | 设备 控制 3 | Us | 单元 分 隔 符 
HT | 横向 列表 | pc4 | 设 名 控制 4 | DEL | 删除 
VT | 地 列表 | sYN | 空转 步 | | 


由 于 计算 机 普遍 使 用 1 个 字 节 作为 最 小 的 存储 和 处 理 单 元 , 存储 一 个 7 位 ASCII 
码 只 需要 1 个 字 节 ， 而 且 还 多 余 1 位。 因此， 计算 机 普遍 将 ASCII 码 放 到 字 节 的 低 
7 位， 最 高 位 补 零 。 
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西 文字 符 可 以 用 ASCII 码 表 示 ， 中 文 汉字 怎么 办 ? 不 只 中 文 ， 各 国语 言 都 有 各 
自 特 点 ， 所 涉及 字符 较 多 ， 肯 定 无 法 在 1 个 字 节 内 表示 。 中 文 不 是 世界 通用 语言 ， 
计算 机 也 不 是 由 中 国人 最 先 发 明 ， 所 以 ， 中 文字 符 表 示 问 题 直 到 计算 机 进入 中 国 才 
开始 由 中 国人 首先 研究 .中国 国家 标准 总 局 颁布 了 《信息 交换 用 汉字 编码 字符 集 一 一 
基本 集 》( 代 号 GB 2312-80)， 即 国标 码 ， 也 称 GB2312 编码 。 

国标 码 包 括 6 763 个 汉字 和 682 个 其 他 基本 图 形 字符 ， 共 计 7 445 个 字符 。 所 
有 国标 字符 组 成 一 个 94X94 的 矩阵 ， 在 该 矩阵 中 ， 每 一 行 称 为 一 个 “区 ” 每 一 列 
称 为 一 个 “位 ?。 所 以 ， 该 矩阵 有 94 个 区 号 〈01 一 94) 和 94 个 位 号 〈01 一 94)。 

国标 码 的 字符 数 少 于 2 (65 536)， 因 此 ， 每 个 汉字 用 2 字 节 表示 即 可 ， 其 中 
每 个 字 节 仅 使 用 低 7 位 代码 ， 最 高 位 为 0。 第 一 个 字 节 表示 汉字 在 国标 字符 集中 的 
区 编号 ， 第 二 个 字 节 表示 汉字 在 国标 字符 集中 的 位 编号 。 通 过 区 位 索引 表示 对 应 的 
汉字 。 

由 于 计算 机 的 键盘 一 般 是 英文 字母 键盘 ， 所 以 ， 产 生 了 从 字母 组 合 中 识别 汉字 
的 问题 ,于 是 有 了 输入 法 。 汉 字 输 入 法 包括 区 位 码 、 首 尾 码 、 拼 音 码 、 快 速 首尾 码 、 
五 笔 字 型 码 、 电 报 码 、 仓 匣 码 、 声 韵 、 拼 形 码 及 笔 形 码 等 。 甚 至 只 用 1 一 5 这 5 个 数 
字 也 能 输入 汉字 ， 俗 称 12345 数字 输入 法 ， 这 是 中 国人 的 智慧 ， 只 有 想不到 ， 没 有 
做 不 到 。 

国标 码 解 决 了 汉字 被 计算 机 系统 表示 和 存储 的 问题 。 那 如 何在 显示 器 或 打印 机 
上 和 输出 汉字 呢 ? 这 需要 对 汉字 构建 字形 点 阵 图 。 以 “ 英 ” 字 为 例 ， 如 附 图 A.1 所 示 ， 
如 果 直 接 存 储 点 阵 图 则 需要 较 大 的 存储 空间 ， 所 以 ， 科 学 家 设计 了 点 阵 代码 。 简 单 
地 说 ,点 阵 代码 就 是 点 阵 图 的 一 种 表示 , 例如 将 “ 英 ” 所 在 区 域 看 成 16X16 的 和 矩阵， 
该 字 第 一 行 只 有 2 个 位 置 涂 黑 , 所 以 这 行 16 个 位 置 以 涂 黑 为 1 其 余 为 0 可 以 表示 为 
0x0410 十 六 进 制 形式 ， 以 0x 开头 是 表示 十 六 进 制 数 的 一 种 常用 形式 )。 因 此 ， 一 
个 汉字 可 以 由 一 组 这 样 的 十 六 进 制 数 表 示 ， 当 需要 显示 汉字 时 ， 只 需要 在 输出 设备 
上 构建 一 个 16X16 矩阵 ,然后 按照 这 些 数字 的 指引 涂 黑 部 分 区 域 , 即 可 形成 汉字 形 
状 。 当 然 ， 点 阵 规模 小 ， 分 辩 率 差 ， 字 形 不 美观 ， 但 占用 存储 空间 小 ， 易 于 实现 。 
点 阵 规 模 大 ， 分 辩 率 高 ， 字 形 美观 ， 但 所 用 存储 空间 也 大 。 


0 7 8 15 

of | | Tliellilill| le [T1100 

CT | | le 1 | [owto 

国 OOOOOOOOOOOOOOEpss 
liel | || | 


听 . 
| | @ | le | le@| | | | |0.% 
lasso eosee 
I®| 


附 图 A.1 字形 点 阵 及 点 阵 编码 实例 
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计算 机 已 经 可 以 处 理 英文 和 中 文字 符 了 ， 但 是 ， 世 界 上 还 有 很 多 其 他 语言 ， 怎 
么 办 呢 ? 计算 机 科学 家 从 全 球 化 视野 角度 考虑 ， 设 计 了 一 种 能 够 囊括 世界 上 所 有 语 
言 字符 的 编码 方式 ， 称 为 Unicode 编码 。 

Unicode 是 一 种 在 国际 上 被 广泛 采用 的 计算 机 符号 编码 标准 。 对 于 世界 上 绝 大 
多 数 语言 所 包含 的 文字 ，Unicode 都 赋予 它们 一 个 唯一 的 编码 。Unicode 是 一 个 符号 
编码 集合 ， 它 采用 2 个 字 节 ， 即 16 位 二 进 制 对 字符 编码 ， 从 0x0000 到 0xFFFF,， 共 
包括 2 (65 536) 个 编码 。 例 如,“ 语 言 ” 两 个 符号 的 编码 分 别 为 0x8BED 和 0x8A00， 
“Python”6 个 字母 的 编码 分 别 为 0x0050、0x0079、0x0074、0x0068、0x006F 和 0x006E。 

Unicode 只 是 规定 了 符号 编码 ， 并 没有 规定 如 何 存储 和 传输 这 些 编码 。UTEF-8 
是 一 个 以 字 节 为 单位 的 变 长 编码 方式 ， 用 于 规范 Unicode 编码 的 存储 和 使 用 。 
Unicode 编码 和 UTF-8 编码 的 对 应 规则 如 附 表 A.3 所 示 。 


附 表 A.3 Unicode 编码 和 UTF-8 编码 的 对 应 规则 


Unicode 符号 范围 (十 六 进 制 》 UTF-8 编码 方式 (二 进 制 ) 
0000 0000 一 0000 007F OxxXXXXX 
0000 0080 一 0000 07FF 110xxxxx 10xXXXXX 
0000 0800 一 0000 FFFF 1110xxxx 10xxxxxx 10xxxxxx 
0001 0000 一 0010 FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 


以 “Python 语言 ”为 例 ， 两 个 编码 的 比较 如 附 表 A.4 所 示 。 可 以 看 到 ， 如 果 符 
号 是 英文 字母 ， 确 切 说 是 0x7F 以 内 的 所 有 符号 ，UTF-8 编码 只 使 用 1 个 字 节 表示 ， 
更 加 节省 存储 空间 ， 对 于 中 文字 符 ，UTF-8 编码 采用 3 个 字 节 表示 ， 相 比 Unicode 
却 增 加 了 存储 空间 。 由 于 现代 计算 机 系统 的 文本 信息 大 多 采用 英文 符号 , 使 用 UTF-8 
编码 更 能 节省 实际 存储 空间 。 


附 表 A.4 “Python 语言 ”的 Unicode 编码 和 UTF-8 编码 比较 


符 ”号 Unicode 符号 编码 UTF-8 编码 
1 50 
h 00 68 68 
8 GF 
ES AFAD 
ES AS 80 


简单 地 说 , Unicode 是 对 全 球 字 符 的 统一 编码 , UTF-8 是 对 Unicode 存储 和 使 用 
的 编码 ， 将 两 者 分 开 只 是 为 了 在 存储 西 文字 符 时 可 以 有 效 节 省 存储 空间 。 要 看 到 ， 
计算 机 发 展 至 今 的 绝 大 部 分 时 间 ， 计 算 机 存储 和 性 能 都 不 足以 支撑 计算 机 应 用 ， 这 
种 将 Unicode 字符 统一 编码 和 UTF-8 存储 编码 分 开 的 设计 虽然 在 编码 上 看 似 复杂 ， 
却 实 实在 在 节省 了 存储 空间 ， 计 算 机 科学 家 们 可 谓 用 心 良 苦 。 

至 此 ， 用 0 和 1 已 经 能 够 有 效 表示 所 有 字符 了 ， 但 字符 不 是 信息 。 人 类 需要 的 
信息 该 如 何 表 示 呢 ? 
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首先 ， 需 要 明确 ， 信 息 是 数据 在 特定 背景 下 的 诠释 。 一 个 数据 1010， 它 可 以 是 
二 进 制 数 1010， 也 可 以 是 十 进 制 数 1010， 更 可 以 是 类 似 名 字 的 字符 串 1010， 到 底 
它 是 什么 ? 严格 来 说 ，1010 只 是 数据 ， 你 认为 它 是 什么 信息 ， 它 就 是 什么 信息 ， 诠 
释 方 法 由 解读 的 人 说 了 算 。 因 此 ， 计 算 机 领域 一 般 不 用 “信息 ”这 个 词 ， 它 太 主 观 
了 ， 而 用 “数据 ” 无 论 是 数字 、 音 乐 还 是 文字 、 视 频 都 可 以 称 为 数据 。 

其 次 ， 数 据 分 为 结构 化 数据 与 非 结构 化 数据 。 结 构 化 数据 一 般 是 指 存储 在 数据 
库 中 ， 可 以 用 一 维 或 二 维 表 结构 表示 的 数据 。 相 反 地 ， 不 便于 用 二 维 逻辑 表 来 表现 
的 数据 称 为 非 结构 化 数据 ， 如 图 像 、 音 频 、 视 频 等。 在 结构 化 和 非 结 构 化 之 间 ， 还 
存在 一 种 半 结 构 化 数据 ， 它 一 般 特 指 能 够 整合 表示 结构 化 和 非 结 构 化 数据 的 数据 ， 
例如 超 文 本 标记 语言 CHTML ) 文档 。 

中 小 规模 数据 可 以 通过 数据 库 或 文件 系统 进行 管理 ， 无 论 结构 化 还 是 非 结构 化 
数据 都 可 以 用 HTML 方式 通过 万 维 网 (WWW) 发 布 在 Internet 上 。 一 时 间 ， 数 字 
化 席卷 全 球 ， 人 类 开始 将 尽 可 能 多 的 信息 转换 成 数据 。 新 世纪 伊始 的 2000 年 ， 以 数 
字形 式 存储 的 信息 只 占 全 球 数据 量 的 23%， 其 余 信 息 通过 报纸 、 胶 片 、 盒 式 磁带 等 
传统 媒介 存储 。 到 了 2007 年 ， 这 一 占 比 迅速 超过 了 90%。 而 之 后 的 2012 和 2013 
两 年 间 ， 互 联网 产生 的 数据 已 经 等 于 人 类 有 史 以 来 至 2011 年 所 产生 数据 量 的 总 和 。 
全 球 数据 总 量 呈 指数 级 快速 增长 。 

到 了 今天 ， 数 据 比 以 往 任何 时 候 都 更 加 深入 、 紧 密 地 与 人 类 日 常 活动 交织 在 一 
起 。 各 类 仪器 设备 、 传 感 器 、 网 上 交易 、 网 络 日 志 、 电 子 邮 件 、 视 频 、 点 击 流 、 地 
理 位 置信 息 ， 以 及 现在 与 未 来 所 有 可 被 利用 的 其 他 数字 化 信息 源 产生 的 数据 ， 呈 现 
出 海量 、 多 样 、 复 杂 、 纵 深化 与 分 布 式 的 发 展 态势 。 

举 个 例子 ， 一 张 医疗 CT 图 像 含 有 大 约 150 MB 的 数据 ， 而 一 个 基因 组 序列 文 
件 大 小 约 750 MB, 一 个 标准 的 病理 图 与 前 两 者 相 比 则 大 得 多 , 文件 大 小 接近 5 GB。 
如 果 将 这 个 数据 量 乘 以 人 口 数量 和 平均 寿命 ， 仅 一 个 社区 医院 或 一 个 中 等 规模 制药 
企业 就 可 以 生成 和 累积 数 太 字 节 (TB， 约 等 于 10”) 甚至 数 拍 字 节 (PB， 约 等 于 
105) 数据 。 

可 以 看 到 ， 人 类 通过 信息 技术 已 经 开始 产生 大 量 (Volume) 数据 ， 大 部 分 数据 
以 高 速 (Velocity) 动态 产生 ， 包 括 格式 化 、 非 格式 化 和 半 格 式 化 等 多 种 (Variety) 
形式 , 然而 ,很 多 动态 产生 的 数据 价值 (Value) 较 低 , 但 也 有 少 部 分 数据 价值 很 高 。 
大 量 、 高 速 、 多 样 和 价值 这 4 个 特点 形成 了 一 种 对 数据 新 的 描述 和 定义 ， 史 称 “ 大 
数据 ”。 

从 0 和 1 开始 ， 人 类 最 终 迎 来 了 大 数据 时 代 ! 这 个 过 程 中 ， 计 算 机 硬件 以 摩尔 
定律 预测 的 模型 在 快速 发 展 ， 默 默 地 支持 着 人 类 的 数据 产生 和 处 理 需 求 。 


A.2 计算 机 硬件 组 成 


一 个 微小 电路 最 容易 实现 两 个 状态 ， 高 电 平 或 低 电 平 ， 而 高 低 电 平 可 以 控制 电 
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路 的 接 通 或 断 开 。 简 单 地 说 ， 一 个 电路 ， 或 高 电 平 或 低 电 平 ， 就 可 以 表示 数据 。 

以 高 纯度 硅 为 代表 的 半导体 器 件 有 能 力 受 电压 控制 ， 这 个 物理 现象 促使 科学 家 
设计 了 CMOS (互补 金属 氧化 物 半 导体 器件 ， 这 是 一 种 将 硅 和 氧化 物 按 照 特定 方 
式 制 作 的 结构 ， 它 能 够 根据 高 低 电 平 控制 电路 通 断 。 进 一 步 ， 工 程 师 将 大 量 CMOS 
制作 在 一 起 , 设计 合理 结构 ， 形 成 了 集成 电路 ,而 集成 电路 则 具备 数据 计算 的 功能 ， 
成 为 了 现代 计算 机 的 组 成 部 件 。 单 个 CMOS 及 衍生 设计 也 被 称 为 晶体 管 。 

从 历史 视角 来 看 ， 半 导体 工业 近 50 年 快速 发 展 , 发 展 速 度 远 超 其 他 领域 。 这 其 
中 ， 英 特 尔 〈Intel) 公司 堪 称 是 该 领域 的 绝对 引领 者 ， 没 有 之 一 。1971 年 ，Intel 公 
司 推出 了 世界 第 一 枚 CPU (Central Processing Unit， 中 央 处 理 器 )， 代 号 4004， 其 
中 单个 晶体 管 门 电路 尺寸 为 10 hm (10 000 纳米 )， 整 个 CPU 包含 2 250 个 晶体 管 ， 
时 钟 频率 108 kHz。 在 此 之 前 ， 英 特 尔 公 司 创 始 人 之 一 的 戈 登 。 摩 尔 于 1965 年 先 见 
性 地 提出 了 摩尔 定律 ,指出 单位 面积 集成 电路 可 容纳 晶体 管 的 数量 约 每 两 年 翻 一 倍 。 
此 后 , 该 公司 带领 半导体 工业 一 路 发 展 ， 到 2016 年 , 全 球 半导体 工业 已 经 可 以 量 产 
14 nm 单元 的 集成 电路 , 英特尔 公司 最 新 的 SkyLake 架构 CPU 采用 14 nm 晶体 管 门 
电路 ， 单 CPU 包含 超过 30 亿 个 晶体 管 ， 频 率 超过 3 GHz。CPU 诞生 后 的 45 年 间 ， 
单 唱 体 管 尺寸 下 降 了 接近 1 000 倍 ， 单 集成 电路 容量 提升 了 1 000 万 倍 ， 频 率 提 高 
了 3 万 倍 ! 

半导体 技术 的 蓬勃 发 展 带 来 了 大 量 可 用 的 晶体 管 ， 计 算 机 系统 结构 也 伴随 着 晶 
体 管 数量 从 单 CPU 结构 向 多 CPU 多 核发 展 。 无论 CPU 结构 如 何 发 展 , 现代 计算 机 
组 成 结构 就 其 本 质 而 言 还 是 以 图 灵机 模型 为 理论 基础 、 以 存储 程序 结构 为 指导 思想 
发 展 而 成 。 

艾 伦 ' 图 灵 提 出 了 计算 机 早期 的 理论 模型 一 一 图 灵机 。 这 是 一 个 抽象 的 数学 
结构 ， 但 它 能 够 按照 指令 方式 处 理 数据 ， 指 导 了 后 期 计算 机 的 设计 。 美 籍 犹 太 人 
冯 。 诺 依 曼 参 与 了 早期 大 型 电子 计算 机 的 设计 ， 提 出 了 两 个 非常 经 典 的 设计 ， 对 计 
算 机 组 织 结构 发 展 起 到 了 深远 影响 。 这 两 个 设计 是 “存储 程序 结构 ”和 “二 进 制 编 
码 ”。 根据 冯 “" 诺 依 曼 的 设想 ， 计 算 机 必须 具有 五 大 部 件 : 运算 器 、 控 制 器 、 存 储 器 、 
输入 设备 和 输出 设备 ， 如 附 图 A.2 所 示 。 


附 图 A.2 存储 程序 结构 的 五 大 部 件 


数据 从 输入 设备 进入 计算 机 ， 控 制 器 将 运算 指令 从 存储 器 中 读 取 出 来 ， 根 据 指 
令 控 制 运 算 器 处 理 输入 数据 ， 如 果 产 生 中 间 结 果 则 放 到 存储 器 中 ， 产 生 最 终结 果 由 
输出 设备 输出 。 这 个 结构 简单 有 效 ， 其 核心 是 将 指令 和 缓存 数据 放 到 存储 器 中 ， 因 
此 ， 该 结构 被 命名 为 “存储 程序 结构 ” 也 被 称 为 汉 。 诺 依 曼 结构 。 
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在 计算 机 的 具体 实现 中 ， 由 于 控制 器 和 运算 器 很 难 分 离 ， 因 此 ， 它 们 便 在 一 起 
组 成 了 CPU。 早 期 CPU 只 有 这 两 个 部 件 ， 随 着 半导体 工业 提供 了 更 多 的 晶体 管 ， 
CPU 也 包含 了 部 分 存储 器 ， 被 称 为 高 速 缓冲 存储 器 ， 用 于 加 速 CPU 运算 。 至 此 ， 
计算 机 有 了 中 央 运 算 单 元 ， 那 存储 器 怎么 组 织 呢 ? 

半导体 工业 提供 了 大 量 晶体 管 ， 除 了 用 于 生产 CPU 外 ， 还 被 用 来 生产 存储 器 。 
用 晶体 管 生产 的 存储 器 被 当 作 计 算 机 系统 中 的 内 存 , 辅助 CPU 运算 。 但 由 于 晶体 管 
在 掉 电 时 无 法 保存 数据 ， 有 效 输出 结果 不 能 永久 保存 在 内 存 中 ， 工 程 师 又 设计 了 基 
于 磁 介 质 的 可 永久 保存 数据 的 存储 器 ， 俗 称 为 外 在 ， 包 括 硬 盘 、U 盘 、 磁 带 等 。 

存储 设备 总 以 字 节 为 单位 保存 数据 ， 通 过 地 址 访问 字 节 内 容 。 地 址 存放 思路 类 
似 于 门牌 号 ， 即 为 每 个 字 节 赋予 一 个 地 址 ， 如 1010， 当 计算 机 需要 访问 1010 地 址 
的 内 容 时 ， 存 储 器 找到 这 个 字 节 ， 并 将 其 返回 。 

输入 设备 一 般 采 用 键盘 、 鼠 标 、 扫 描 仪 、 手 写 笔 等 形式 ， 输 出 设备 包括 显示 器 、 
打印 机 等 。 随 着 网 络 的 发 展 ， 网 络 接口 成 为 了 新 的 输入 和 输出 设备 。 到 此 ， 五 大 部 
件 及 对 应 设备 都 各 自发 展 起 来 ， 计 算 机 成 为 了 普通 的 计算 设备 ， 以 个 人 计算 机 或 手 
机 等 形式 ， 走 进 大 众生 活 。 

CPU 有 一 个 重要 的 技术 指标 ， 称 为 字 长 ， 指 CPU 一 次 能 处 理 的 二 进 制 位 数 ， 
字 长 总 是 8 的 整数 倍 。PC 的 字 长 早期 为 16 位 、32 位 ， 现 代 计 算 机 都 是 64 位 (高 
性 能 计算 机 或 服务 器 的 字 长 从 16 位 到 1 024 位 ， 甚 至 更 长 )。 字 长 不 仅 表示 CPU 一 
次 处 理 数据 的 长 度 ， 也 可 表示 参与 运算 数据 的 位 数 和 精度 。 显 然 ， 用 32 位 表示 一 个 
小 数 ， 如 圆周 率 ， 不 如 64 位 表示 精确 。 所 以 ，64 位 计算 机 具有 更 好 的 性 能 和 精确 度 。 

CPU 的 通用 计算 性 能 有 了 保障 ， 人 类 却 有 了 更 高 的 需求 ， 精 美 游戏 、3D 引擎 、 
虚拟 现实 等 不 仅 需 要 大 量 的 计算 资源 , 还 需要 对 图 像 和 视频 有 更 好 的 显示 效果 。CPU 
只 负责 计算 ， 其 硬件 结构 不 适合 绘图 。 从 早期 个 人 计算 机 开始 ， 显 示 图 像 的 任务 都 
由 图 形 显示 卡 〈 简 称 显卡 ) 完成 ， 早 期 的 显卡 功能 还 十 分 有 限 ， 它 只 是 计算 机 中 的 
一 个 扩展 ， 核 心 采用 一 枚 显示 芯片 。 然 而 ， 显 卡 背后 的 设计 公司 却 非常 励志 ， 这 些 
公司 充分 利用 了 半导体 工业 产生 的 大 量 唱 体 管 ， 设 计 了 性 能 非常 高 的 显卡 芯片 ， 被 
称 为 “图 形 处 理 器 ”(Graphics Processing Unit，GPU)。GPU 不 仅 能 完美 地 泻 染 各 种 
高 清晰 图 像 和 三 维 效果 , 其 高 度 的 并 行 结 构 和 计算 性 还 被 用 来 替代 CPU 进行 大 规模 
科学 计算 。 部 分 GPU 还 集成 了 CPU 的 功能 ， 大 有 完全 取代 CPU 的 发 展 态势 。 然 后 
呢 ? CPU 会 被 GPU 成 功 首 袭 吗 ? 

从 半导体 晶体 管 到 GPU 逆 袭 , 计算 机 硬件 在 竞争 中 走 过 了 近 50 年 的 发 展 历 程 ， 
将 人 类 成 功 送 进 了 信息 时 代 。 学 术 界 仍 在 制造 下 一 个 可 能 逆 袭 CPU 的 概念 ， 工 业界 
硝烟 弥漫 资本 伺机 而 动 ， 这 一 切 预示 着 计算 机 硬件 将 在 未 来 还 有 更 值得 期 待 的 大 事 
件 。 拭 目 以 待 ! 


A.3 计算 机 软件 平台 


直接 控制 CPU 运行 的 指令 叫 机 器 指令 。 机 器 指令 可 以 精细 到 控制 一 个 字 节 数据 
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的 移动 和 和 运算， 然而， 计算 机 系统 不 只 有 CPU， 还 有 输入 输出 设备 和 存储 器 ， 更 大 
的 计算 机 系统 包括 多 个 输入 输出 设备 。 同 时 ， 人 类 的 计算 需求 也 不 只 是 完成 一 些 简 
单 的 计算 任务 。 简 单 地 说 ， 在 计算 机 硬件 之 上 ， 人 类 需要 一 个 “助手 ” 它 能 更 好 地 
管理 计算 机 ， 并 为 计算 机 使 用 者 提供 更 加 便捷 友好 的 交流 方式 。 这 个 需求 产生 了 操 
作 系 统 。 

能 够 直接 与 硬件 平台 交流 的 计算 机 软件 是 操作 系统 。 操 作 系统 是 计算 机 系统 中 
最 底层 的 软件 ， 它 控制 所 有 在 计算 机 中 运行 的 程序 ， 管 理 整 个 计算 机 资源 ， 存 储 和 
调度 所 有 数据 ， 它 是 计算 机 硬件 与 应 用 程序 及 用 户 之 间 的 桥梁 。 

操作 系统 能 够 提供 更 加 友好 的 界面 ， 使 用 户 更 为 方便 地 使 用 应 用 软件 ， 例 如 ， 
电子 制 表 软 件 、 字 处 理 器 、 网 页 浏览 器 和 电子 邮件 软件 等 ， 它 允许 程序 员 利 用 编程 
语言 调用 其 功能 ， 也 能 帮助 运行 编程 语言 编写 的 程序 。 没 有 操作 系统 的 硬件 固然 能 
运行 程序 ， 但 也 是 用 户 的 使 用 灾难 。 

操作 系统 是 计算 机 系统 的 控制 和 管理 中 心 ， 从 用 户 角度 来 看 ， 操 作 系 统 是 用 户 
与 计算 机 硬件 系统 之 间 的 接口 ， 从 资源 管理 角度 看 ， 操 作 系 统 是 计算 机 系统 资源 的 
管理 者 ， 它 的 主要 目的 就 是 简单 、 高 效 、 公 平 、 有 序 和 安全 地 使 用 这 些 资源 。 

操作 系统 并 非 与 计算 机 硬件 一 起 诞生 ， 它 是 在 人 们 使 用 计算 机 的 过 程 中 ， 为 了 
提高 资源 利用 率 和 增强 计算 机 系统 可 用 性 而 逐步 发 展 形成 的 。 

早期 的 操作 系统 采用 命令 行 模 式 ， 也 称 控制 台 模 式 。 用 户 调用 操作 系统 提供 的 
命令 与 操作 系统 交互 。 在 20 世纪 90 年 代 初 ， 出 现 了 带 有 视窗 的 操作 系统 ， 显 著 提 
高 了 用 户 体验 ， 也 推动 了 个 人 计算 机 的 普及 。 

目前 流行 的 操作 系统 主要 有 Windows、UNIX、Linux、Mac OS X、Android、 
BSD、iOS、AIX、Windows Phone 和 z/OS 等 ， 除 了 Windows 和 z/OS 等 少数 操作 系 
统 ， 大 部 分 操作 系统 都 为 类 UNIX 操作 系统 。 

UNIX 是 一 个 强大 的 多 用 户 、 多 任务 操作 系统 ， 支 持 多 种 处 理 器 架构 ， 按 照 操 
作 系 统 的 分 类 属于 分 时 操作 系统 。UNIX 最 早 由 Ken Thompson 和 Dennis Ritchie 于 
1969 年 在 美国 AT&T 的 贝尔 实验 室 开 发 。 在 设计 开发 UNIX 操作 系统 的 过 程 中 ， 
Ken 和 Dennis 发 现 编程 语言 对 开发 操作 系统 至 关 重 要 , 于 是 他 们 合作 设计 并 开发 了 
一 种 用 于 开发 UNIX 系统 的 编程 语言 一 一 C 语言 。UNIX 操作 系统 和 C 语言 对 计算 
机 软件 的 发 展 产 生 了 极其 重大 和 深远 的 影响 ,而 它们 却 仅 由 两 位 程序 员 设 计 和 完成 。 

Linux 操作 系统 是 1991 年 推出 的 一 个 多 用 户 、 多 任务 的 操作 系统 ， 与 UNIX 完 
全 兼容 ，Linux 最 初 是 由 芬兰 赫尔辛基 大 学 计算 机 系 学 生 Linus Torvalds 参照 UNIX 
思想 开发 的 ， 实 际 上 ， 他 只 开发 了 一 个 操作 系统 的 内 核 程序 ， 动 机 是 兴趣 和 学 习 需 
要 。 然 而 ，Linus 却 做 了 一 件 “ 大 事 ”， 他 把 写 好 的 Linux 内 核 源 代码 放 到 了 网 上 ， 
供 其 他 人 下 载 、 更 新 和 开发 。 因 为 当时 UNIX 操作 系统 并 不 开放 源 代码 且 要 支付 使 
用 费用 ，Linux 的 开源 得 到 了 世界 各 地 程序 员 的 极 大 关注 和 支持 ， 随 后 ， 在 全 球 开 
源 运 动 的 浪潮 下 ，Linux 从 一 个 内 核发 展 为 完善 的 操作 系统 。 今 天 ， 全 球 70% 以 上 
在 运行 的 服务 器 采用 Linux 操作 系统 。 

Mac OSX 是 苹果 公司 开发 并 在 其 产品 中 使 用 的 操作 系统 。Mac OS 是 首 个 在 商 
用 领域 采用 图 形 用 户 界面 的 操作 系统 ，Mac OS X 是 Mac OS 的 最 新 版 本 ， 于 2001 
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年 首次 推出 。 苹 果 公 司 的 发 展 和 乔布斯 的 故事 成 为 了 一 个 时 代 的 标志 和 传奇 。 

iOS 操作 系统 是 苹果 公司 为 移动 设备 开发 的 操作 系统 ， 于 2007 年 发 布 。 该 系统 
最 初 专 为 iPhone 设计 ， 后 来 陆续 支持 iPod、iPad 以 及 Apple TV 等 苹果 公司 产品 。 
iOS 与 Mac OSX 操作 系统 一 样 ， 同 属于 类 UNIX 的 商业 操作 系统 。 

Android 是 iOS 系统 的 重要 竞争 对 手 ， 它 由 谷歌 公司 推出 ， 以 Linux 为 基础 开 
发 ， 且 全 系统 开放 源 代码 ， 主 要 用 于 便携 和 移动 设备 。 在 智能 手机 领域 ， 除 了 苹果 
手机 采用 iOS 系统 ， 其 他 主要 品牌 手机 都 采用 Android 系统 。 

从 机 器 指令 到 PC 操作 系统 ， 从 PC 操作 系统 到 手机 操作 系统 , 计算 机 软件 平台 
在 不 断 演进 。 支 持 移动 设备 后 ， 计 算 机 软件 平台 又 该 如 何 发 展 ? 

一 台 计 算 机 一 般 只 能 运行 一 个 操作 系统 ， 这 是 由 操作 系统 最 初 的 设计 需求 决定 
的 。 然 而 ， 计 算 机 性 能 日 益 提高 ， 用 户 产 生 了 在 一 台 计 算 机 上 运行 多 个 操作 系统 的 
需求 ， 因 此 ， 计 算 机 软件 平台 进入 了 “虚拟 化 ”的 新 阶段 。 

虚拟 化 〈Virtualization ) 是 一 种 资源 管理 技术 ， 它 将 计算 机 的 各 种 实体 资源 ， 
如 服务 器 、 网 络 、 内 存 及 存储 等 ， 予 以 抽象 、 转 换 后 呈现 出 来 ， 打 破 实体 结构 间 不 
可 切割 的 障碍 ， 使 用 户 可 以 灵活 设计 并 配置 硬件 资源 ， 采 用 一 个 或 多 个 操作 系统 管 
理 其 中 的 部 分 或 全 部 资源 。 

虚拟 化 的 一 个 重要 呈现 形式 是 虚拟 机 ， 它 通过 软件 模拟 有 具有 完整 功能 的 、 运 行 
在 隔离 环境 中 的 完整 计算 机 硬件 。 通 过 虚拟 机 软件 ， 用 户 可 以 在 一 台 物 理 计 算 机 上 
模拟 出 一 台 或 多 台 虚 拟 的 计算 机 ， 这 些 虚拟 计算 机 具有 和 真实 硬件 一 样 的 部 件 ， 但 
能 力 略 进 。 在 虚拟 机 内 部 ， 用 户 可 以 安装 操作 系统 、 应 用 程序 、 访 问 网 络 资源 等 ， 
用 户 的 感受 与 使 用 一 台 真 实物 理 主 机 一 样 。 

宿主 计算 机 〈Host PC) 指 物理 存在 的 安装 了 虚拟 机 软件 的 计算 机 ， 这 人 台 计 算 机 
安装 运行 的 操作 系统 被 称 作 宿主 操作 系统 (Host OS)。 

客户 计算 机 (Guest PC) 指 虚 拟 机 软件 中 被 虚拟 出 来 的 计算 机 ， 客 户 计算 机 安 
装 的 操作 系统 被 称 为 客户 机 操作 系统 (Guest OS)。 

虚拟 机 和 虚拟 化 有 多 流行 呢 ? 这 么 说 ， 现 在 所 有 最 新 的 CPU 都 支持 虚拟 化 指 
令 ， 也 直接 支持 虚拟 机 运行 。 这 将 是 未 来 操作 系统 和 计算 机 硬件 之 间 一 个 新 的 软件 
平台 。 

下 面 介绍 一 款 经 典 的 虚拟 机 软件 VirtualBox， 它 也 是 开源 软件 。 

VirtualBox 最 早 由 德国 InnoTek 软件 公司 出 品 ， 现 在 由 甲骨 文 Oracle) 公司 进 
行 开 发 。 它 允许 用 户 在 32 位 或 64 位 的 Windows、Solaris 及 Linux 操作 系统 上 虚拟 
其 他 操作 系统 的 功能 。 用 户 可 以 在 VirtualBox 上 安装 并 且 运 行 Solaris、Windows、 
DOS、Linux、OS/2 Warp、OpenBSD 及 FreeBSD 等 系统 作为 客户 机 操作 系统 。 

安装 VirtualBox， 首 先进 入 官方 网 站 https://www.virtualbox.org/， 选 择 适合 自己 
现 有 操作 系统 的 版 本 下 载 ， 安 装 界面 如 附 图 A.3 所 示 。 

提示 步骤 很 简单 ， 安 装 结束 后 ， 打 开 VirtualBox， 如 附 图 A.4 所 示 。 

通过 该 软件 可 以 配置 新 的 虚拟 计算 机 ， 并 为 生成 的 虚拟 计算 机 安装 操作 系统 。 
请 准备 一 个 拟 安 装 系统 的 镜像 文件 ， 本 例 拟 安装 一 种 Linux 操作 系统 一 一 Ubuntu 
14.04。 
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| 起 Oracle VM VirtualBox 5.1.6 Setup X | 


Welcome to the Oracle VM 
VirtualBox 5.1.6 Setup Wizard 


The Setup Wizard wil instal Orade VM VirtualBox 5.1.6 on 
your computer, Click Next to continue or Cancel to exit the | 
Setup Wizard, 


Version 5.4.6 [Card | 


附 图 A.3” VirtualBox 安装 界面 


国 全 理 份 (系统 快照] 


窗口 的 左边 用 来 显示 已 生成 的 虚拟 电脑 ， 现 在 是 空 的 ， 因 为 你 还 没有 新 建 任 
何 虚 拟 电脑 . S 


要 新 建 一 个 虚拟 电 访 ， 请 按 位 于 窗口 顶部 工具 栏 JP 
的 新 建 按钮 


妆 g 各 


你 可 以 按 FI 键 来 查看 帮助 ， 或 访问 
mm virtualbox. ovg 查看 最 新 信息 和 新 闻 . 


附 图 A.4 ”VirtualBox 启动 界面 


通过 附 图 A.4 界面 菜单 上 的 “新 建 ”按钮 来 新 建 虚拟 机 ， 并 选择 拟 创 建 虚拟 机 
存储 的 磁盘 位 置 、 类 型 、 版 本 ， 如 附 图 A.5 所 示 。 新 建 的 虚拟 机 及 虚拟 机 内 部 操作 
系统 在 宿主 机 系统 中 采用 文件 形式 存储 ， 不 会 影响 宿主 机 其 他 应 用 的 运行 。 可 以 将 
虚拟 机 理解 为 一 个 文件 , 用 VirtualBox 打开 这 个 文件 后 , 会 出 现 一 个 新 的 操作 系统 。 
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澄 。 所 saaass 0) 
新 建 W) 设置 ( 写 


新 建 虚拟 计算 机 


请 选择 新 虚拟 计算 机 的 描述 名 称 及 要 安装 的 操作 系统 类 型 。 此 名 
称 将 用 于 标识 此 虚拟 计算 机 。 


名 称 (mD : |D:NYirtual Machines\Ubuntu 14. 04 6 ~| E 
a 人 
类 型 (T) : [请 遇 各 | 二 
版 本 (w) : [RU ES] [a | | 


专家 模式 (E) | 取消 | 


| AS 


确定 安装 操作 系统 版 本 后 ， 按 照 下 一 步 提 示 分 配 虚 拟 机 的 内 存 大 小 、 硬 盘 空 间 
等 ， 请 读者 注意 ， 分 配 的 硬盘 空间 不 会 与 宿主 机 系统 冲突 ， 它 们 将 作为 文件 形式 保 
存在 宿主 机 上 。 准 备 工 作 结束 后 ， 选 择 拟 安装 操作 系统 的 文件 路 径 ， 如 附 图 A.6 所 
示 ， 这 里 选择 了 ubuntu-14.04-desktop-amd64.iso 镜像 文件 ， 用 于 安装 Ubuntu 的 64 
位 操作 系统 。 操 作 系 统 的 iso 镜像 文件 请 到 Ubuntu 官方 网 站 下 载 或 购买 。 


选择 启动 盘 


请 选择 一 个 虚拟 光盘 文件 或 已 放 入 光盘 的 
光驱 来 启动 虚拟 计算 机 ,。 

此 光盘 应 可 启动 并 且 有 你 想 安装 的 操作 系 
统 。 下 次 关闭 虚拟 计算 机 时 ， 此 光盘 可 自 
动弹 出 ; 你 也 可 以 手动 弹出 。 


ubintu-14. 04-desktop-and64. ”| 蚁 


i 3 rieht ctrl 
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操作 系统 安装 后 ， 运 行 启动 ， 客 户 机 操作 系统 可 以 运行 了 。 


A.4 Internet 和 WWW 


网 络 技术 可 以 在 计算 机 之 间 传 递 0 和 1，Internet 将 全 球 计算 机 联网 ， 奇 迹 产 
生 了 ! 

Internet (互联 网 ) 是 网 络 与 网 络 之 间 所 连接 成 的 庞大 网 络 ， 这 个 网 络 以 TCP/IP 
协议 族 为 基础 ， 接 入 设备 达到 几 十 亿 ， 形 成 逻辑 上 的 单一 国际 网 络 ，Internet 是 一 个 
专用 名 词 。 互 联网 很 有 用 ， 它 提供 了 基本 的 信息 传递 能 力 ， 为 人 类 创意 和 想象 空间 
提供 了 平台 。 

WWW (World Wide Web， 万 维 网 ) 简称 Web， 是 Internet 所 提供 的 服务 之 一 ， 
它 基 于 超 文本 链接 将 文本 、 图 像 、 声 音 、 视 频 等 无 颖 地 集成 在 一 起 ， 构 筑 成 密布 全 
球 的 信息 资源 。 为 了 提供 WWW 服务 ， 内 容 提供 者 需要 使 用 Web 服务 器 软件 ， 将 
操作 系统 内 指定 目录 的 内 容 发 布 到 网 络 上 。 

用 户 可 以 使 用 Web 浏览 器 通过 域名 访问 WWW 所 提供 的 内 容 服务 ， 内 容 以 页 
面 为 单位 组 织 ， 超 链接 将 页 面 及 内 部 的 多 媒体 资源 链接 起 来 ， 用 户 无 须 关 心 这 些 文 
件 存 放 在 Internet 上 的 哪 台 计 算 机 中 ， 获 得 内 容 的 过 程 由 WWW 应 用 利用 Internet 
的 连通 性 自动 完成 。 

毫 无 疑问 ， 本 书 读者 都 已 经 使 用 过 Web 浏览 器 ， 并 体会 过 浏览 庞大 网 络 资源 的 
奇妙 功能 。 那 么 超 链 接 是 如 何 构建 的 呢 ? 这 里 需要 介绍 一 门 专用 于 超 链 接 的 置 标语 
言 王 一 了 TML。 

HTML (HyperText Markup Language， 超 文本 置 标语 言 ) 是 一 种 用 于 创建 网 页 
的 标准 标记 语言 , 常 与 CSS、JavaScript 等 编程 语言 一 起 用 于 网 页 前 端 以 及 移动 应 用 
界面 设计 。 浏 览 器 可 以 读 取 HTML 文件 ， 并 将 其 演 染 成 可 视 化 网 页 。HTML 描述 了 
一 个 网 站 的 结构 语义 及 呈现 方式 ， 它 是 一 种 标记 语言 而 非 编程 语言 。HTML 元 素 是 
构建 网 站 的 基石 。 

当 互 联 技术 还 不 成 熟 的 时 候 ， 大 家 关注 Internet， 因 为 有 效 地 传递 0 和 1 是 迫切 
需求 。 在 网 络 技术 成 熟 的 当代 ， 大 家 关注 WWW， 因 为 有 效 地 传播 多 样 信息 是 迫切 
需求 。 关 于 HTML， 请 读者 开展 扩展 阅读 。 


A.5 常用 Python 编辑 器 


需要 明确 的 是 ， 可 以 采用 任何 编辑 器 编写 Python 程序 ， 只 要 按照 Python 语法 
且 保 存 为 文件 ， 程 序 都 可 以 通过 python 命令 运行 。 然 而 ， 功 能 丰富 的 编辑 器 会 带 来 
更 好 的 编程 体验 。 这 里 主要 介绍 3 个 编辑 器 : IDLE、Notepad++ 和 PyCharm。 
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IDLE 可 以 从 Python 官方 网 站 下 载 ， 它 是 软件 包 自 带 的 一 个 集成 开发 环境 ， 建 
议 本 书 读者 使 用 这 个 编辑 器 ， 因 为 它 简单 易 用 ， 可 以 方便 地 创建 、 运 行 、 测 试 和 调 


试 Python 程序 。 
IDLE 界面 如 附 图 A.7 所 示 。 
| 苹 pmhon 3.4.2 Shell | 4 
(Fle Edit Shell Debug Options Windows Help 
Python 3.4.2 {v3.4.2:ab2c023a9432, Oct 6 2014, 22:15:05) [MSC v.1600 32 bic 


(Intel)] on win32 
Type "copyright", "credits" or "iicense()" for more information. 
>>> | 


附 图 A.7 Python IDLE 编辑 器 


从 编辑 器 界面 可 以 看 到 ， 系 统 运行 了 Python 3.4.2 版 本 程序 。 尽 管 这 不 是 最 新 
的 Python 版 本 ， 但 它 对 读者 编写 本 书 实例 已 经 足够 了 。 对 于 部 分 Windows 版 本 操 
作 系统 ， 建 议 读者 安装 3.4 或 者 3.5 版 本 Python 程序 ， 而 不 是 最 新 的 Python 发 布 程 
序 。 这 是 因为 ， 最 新 发 布 程序 往往 带 有 对 新 功能 的 实验 性 质 ， 而 且 更 针对 较 新 版 本 
的 操作 系统 。 如 果 读 者 采用 的 操作 系统 版 本 不 那么 新 ， 采 用 3.4 版 本 是 个 明智 的 

Notepad++ 是 Windows 操作 系统 下 的 一 套 文 本 编辑 器 ， 有 完整 的 中 文 接口 ， 并 
且 支 持 多 国语 言 编写 的 功能 ， 最 主要 的 是 ， 它 对 编程 的 支持 十 分 友好 ， 可 以 支持 并 
高 亮 显 示 多 种 文件 类 型 的 编程 元 素 ， 如 C、C++、 Python、Java、C#、XML、HTML、 
PHP、CSS 等 。Notepad++ 安 装 包 可 以 在 https://notepad-plus-plus.org/ 下 载 ， 启 动 后 编 
辑 Python 程序 的 界面 如 附 图 A.8 所 示 。 

PyCharm 是 由 JetBrains 公司 开发 的 一 款 Python IDE (集成 开发 环境 )， 主 要 针 
对 Python 专业 程序 员 。PyCharm 提供 了 非常 多 的 编程 辅助 功能 ， 比 如 调试 、 语 法 高 
亮 、 项 目 管理 、 代 码 跳 转 、 智 能 提示 、 自 动 完成 、 单 元 测试 、 版 本 控制 等 。 此 外 ， 
PyCharm 还 支持 一 些 高 级 的 Python 第 三 方 库 ， 比 如 Django 框架 下 的 专业 Web 开发 
等 。PyCharm 安装 包 可 以 从 http://www.jetbrains.com/pycharm/ 下 载 获 得 。 

PyCharm 有 两 个 版 本 : 商业 版 和 社区 版 ， 前 者 收费 ， 后 者 免费 。 建 议 本 书 读者 
下 载 社区 版 使 用 。 用 PyCharm 编写 Python 程序 的 界面 如 附 图 A.9 所 示 。 
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褒 cN\usersAdministratomDesktop\hello.py - Notepad++ 一 口 x 
文件 (F) 编辑 (E) 搜索 (5) 视图 (V) 格式 (M) 语言 (L) 设置 (1 宏 (O) 运行 (R) 插件 (P) 窗口 (W) ? x 
TFET EE LOECL I 


附 图 A.9 用 PyCharm 编写 Python 程序 的 界面 
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附录 B 入 机 接口 和 图 形 编程 


彻 比 真 以 龙 大 领 城 ， 羡 对 于 计算 类 太 更 为 要 要 ， 因 为 生 信 起 严 时 党 复 杂 ， 谭 
类 赴 允 复 类 伐 扩 一 邢 终 表 访 物 ， 
Beauty is more important in computing than anywhere else in technology because 


software is so complicated. Beauty is the ultimate defence against complexity. 
大 卫 。 疼 勒 特 (David Gelernter) 
美国 艺术 家 、 作 家 、 耶 鲁 大 学 计算 机 科学 系 教授 


(1) 了 解 计算 机 图 形 学 的 概念 。 

(2) 掌握 图 形 编程 的 基本 方法 及 PyQt5 库 的 使 用 。 
(3) 了 解 鼠 标 、 键 盘 、 文 本 输入 框 的 工作 原理 。 
(4) 掌握 事件 的 原理 和 信号 触发 机 制 。 

(5) 运用 交互 式 编程 进行 图 形 用 户 界 面 开 发 。 
(6) 了 解 艺术 图 像 的 绘制 方法 。 


se 


Ws ES 


从 DOS 命令 行 到 Windows 窗口 ， 图 形 用 户 界面 引领 了 计算 机 交互 行业 一 次 又 
一 次 革命 。 如 今 ， 超 市 的 购物 篮 演变 成 了 网 络 上 的 购物 车 ， 各 种 聊天 工具 的 对 话 框 
逐渐 替代 了 面对面 的 眼神 交流 ， 任 何 信息 只 要 单 击 “ 发 送 ”按钮 就 咱 的 弹射 出 去 ， 
历史 记录 无 论 何 时 都 忠实 地 保存 着 用 户 的 一 言 一 行 。 这 些 已 经 见怪 不 怪 的 功能 蕴含 
了 计算 机 交互 功能 的 规律 。 

一 起 来 了 解 这 些 规律 ， 咱 们 也 编 个 聊天 界面 与 QQ 来 个 正面 对 决 ! 

本 章 以 电子 资源 形式 提供 ， 请 扫描 侧 边 栏 二 维 码 获 取 内 容 。 
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附 孙 C 数据 处 理 和 控 握 


我 杂 磊 恩 入 一 个 煞 的 或 除 秒 细 人 更 更 要 朱 新 夺 侯 。 

We 're entering a new world in which data may be more important than software. 
蒂 姆 。 奥 莱 利 〈Tim O’Reilly) 
O’Reilly 媒体 公司 的 创始 人 兼 CEO、Open Source 和 Web 2.0 概念 的 提出 者 


(1) 了 解数 据 挖 掘 的 基本 概念 。 
(2) 掌握 数据 挖掘 的 基本 方法 。 
(3) 运用 第 三 方 库 实 现 数据 挖掘 的 聚 类 、 分 类 和 回归 方法 。 
(4) 了 解 机 器 学 习 的 基本 概念 。 
(5) 掌握 一 种 聚 类 或 分 类 方法 。 
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数据 挖 据 ， 又 译 为 资料 探 甚 、 数 据 采 矿 。 数 据 挖掘 就 是 在 大 量 数据 中 寻找 有 意 
义 、 有 价值 信息 的 过 程 。 当 别人 空谈 故事 时 ， 我 们 要 学 会 用 数据 说 话 。 在 现代 社会 
中 ， 与 其 求助 于 个 人 的 信息 知识 储备 ， 不 如 借助 网 络 的 海量 信息 筛选 来 完成 特定 的 
任务 ， 这 个 特定 的 任务 对 象 并 不 一 定 是 枯燥 的 表格 ， 它 可 以 是 一 颗 行 星 的 轨道 ， 可 
以 是 云雨 的 变化 ， 或 者 是 ， 一 条 花 ? 

本 章 将 讲述 如 何 使 用 天 均值 方法 根据 花 办 形状 将 花 条 儿 们 分 门 别 类 。 

本 章 以 电子 资源 形式 提供 ， 请 扫描 侧 边栏 二 维 码 获取 内 容 。 


! 找 为 目的 的 内 容 组 织 形式 。 快速 参考 往往 只 列 出 最 重要 的 内 容 , 不 包含 任何 讲解 ，， 
， 用 于 辅助 使 用 者 快速 查找 那些 了 解 但 尚未 记忆 的 内 容 。 本 书 采用 1 页 篇 幅 的 快速 ， 
' 参考 对 应 每 个 建议 读者 掌握 的 “能 力 目标 ”， 读 者 可 以 在 编程 或 复习 时 浏览 这 些 ， 
: 快速 参考 ， 从 而 逐步 达到 这 些 能 力 目 标 。 每 章 末 的 “本 章 小 结 ” 中 将 列 出 与 能 力 ， 
' 目标 同名 的 Python 快速 参考 . 
表 ”全书 共 11 个 快速 参考 索引 
快速 参考 编号 快速 参考 名 称 对 应 章节 
参考 1 Python 基础 语法 要 点 
参考 2 math 库 第 3 章 3.3 节 
参考 3 random 库 第 4 章 4.5 节 
参考 4 datetime 库 第 5 章 5.3 节 
jieba 库 第 6 章 6.5 节 
参考 6 PIL 库 第 7 章 7.2 节 
参考 7 numpy 库 第 9 章 9.2 节 
参考 8 matplotlib 库 第 9 章 9.4 节 
参考 9 Requests 库 第 10 章 10.2 节 
参考 10 Beautiful Soup 库 第 10 章 10.3 节 
参考 11 turtle 库 第 2 章 2.3 节 
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Python 基础 语法 要 点 


库 编程 
from A import * 
bt() + ce() 


import A 
A.b() 


from A import b,c 
ge <a>.<b>0 


文件 操作 函数 
< 变量 名 > = open (< 文件 名 >，< 打 开 模 式 >) 
< 变量 名 >. close () 
<file>.readall () 
<file>.read (size=- 1) 
<file>.readline (size = -1) 
<file>.readlines (hint=- 1) 
<file>.write!(s) 
<file>.writelines (lines) 
<file>.seek (offset) 


序列 类 型 的 

通用 操作 符 和 函数 
x in S 
x not in S 
S 和 睹 全 去 
s[i] s[i: 本 ] 
sli: j% Ki 
min(s) maXx(S) 
s.index (x[, i[, j]]) 
s.count (x) len(s) 


四 
Pa 


YY 


程序 的 分 支 结构 


多 分 支 结构 

< 条 件 1>: 

< 语句 块 1> 

elif < 条 件 2>: 
< 语句 块 2> 


单 分 支 结 构 
if < 条 件 >: if 
< 语句 块 > 
二 分 支 结构 
if < 条 件 >: 
< 语句 块 1> 
else: 


< 语句 块 2> 


else: 


< 语句 块 N> 


| < 表达 式 1> if < 条 件 > else < 表达 式 | 


程序 的 循环 结构 
遍历 循环 
for < 循环 变量 >in< 遍 历 结构 >: 
< 语句 块 > 


无 限 循环 
while < 条 件 >: 
< 语句 块 > 


字典 的 方法 或 操作 

<d>.values () 

<d>.get (<key>, <default>) 
<d>.popitem() <d>.pop (<key>, <default>) 
<d>.clear () del <d>[<key>] 

<key> in <dict> 


<d> .keys () 
<d>.items () 


Python 语言 保留 字 (33 个 ) 


集合 类 型 的 
操作 函数 或 方法 false elif 


-add (x) None else 
“clear () True except not 
.Copy () and finally or 
.pop () as for pass 
.discard (x) assert from raise 
.remove (x) break global return 
len (Ss) class LE tEy 
S.isdisjoint (T) continue import while 
x in S def in with 
ww dE Ti del is yield 


列表 类 型 特有 的 函数 或 方法 
ls[i] = x 

Ss[Es jj = 1 

l8Ilis 33 KE] = 1 

del ls[li; 3] 

del, Ls[is Jj: 0 

s += 七 或 1s.extend (1t) 
ls *= n 

ls.append(x) ls.clear() 
ls.copy() 1s.remove (x) 
UseLinsert(ti, R) 

ls.pop (i) 

ls.reverse (x) 


lambda 
nonlocal 
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math 库 


引入 方式 1 


>>>import math 


宕 对 数 函 数 


>>>math.ceil (10.2) 


math .pow (x, y) math .exp (x) 


math.expml (x) math.sqrt (x) 
引入 方式 2 


>>>from math import floor 
>>>floor (10 .2) 


math.loglp (x) math.1log (x[,base]) 
math.1og2 (x) math.1o0g10 (x) 


数值 表示 函数 三 角 运 算 函 数 


math. fabs (x) math. fmod (x, y) math.degree (x) math,.radians (x) 


math.fsum( [x,y,...]) math. sin (x) math.asin (x) 


math.ceil (x) math.floor (x) math.cos (x) math.acos (x) 


math. factorial (x) math.tan (x) math.atan (x) 


math.gcd (a, b) math.sinh (x) math.asinh (x) 


math. frepx (x) math.cosh (x) math.acosh (x) 


math.1ldexp (x, i) math.tanh (x) math.atanh (x) 


math.modf (x) math .hypot (x,y) math.atan2 (y,x) 


math.trunc (x) 


高 等 特殊 函数 


math.copysign{(x, y) 


math.isclose (a,b) 


math.isfinite (x) math.erf (x) math .erfc (x) 


math.isinf (x) math.isnan (x) machgane matl. Lgammatx) 


数字 常数 


math .pi math.e 


利用 伽 玛 函 数 计算 浮 点 数 阶乘 示例 


>>>math .factorial(10) 
3628800 

>>>math .garmma (11) 
3628800.0 

>>>math .gamma (-11) 
3628800.0 

>>>math .gamma (-10 .2) 
-9.184935416782052e-07 


math.inf math.nan 


浮 点 数 精确 求 和 示例 
> 让 和 十 和 03 
0.6000000000000001 
>>>import math 
>>>math.fsum([0.1, 0.2, 0.3]) 
0.6 
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random 库 


random 库 函数 


seed (a=None) 


getrandbits (k) 


randint (a, b) 
random () 
uniform(a, b) 
choice (seq) 
shuffle (seq) 


sample () 


random. setstate () 


datetime.datetime 类 


now (tz=None) 
isoweekday () 
isoformat (sep="'T') 


strftime (format) 


randrange (start, stop[, step]) 


属性 

min max resolution tzinfo 

year month day hour 

minute Second microsecond 
函数 

today () 


常用 引用 方式 


>>>import jieba 


常用 分 词 函数 


jieba.cut (8) 

jieba.cut (s; cut all=True) 
jieba.cut for search(s) 
jieba.lcut(s) 

jieba. louti(s: cut all=True) 


jieba.lcut for search (S) 


jieba.add word(w) 


datetime 库 


strftime() 格 式 化 控制 符 
SY a 
Sm %H 
$B 务工 
gb %$Pp 
gd $M 
$A %S 
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turtle 库 


引入 方式 控制 画笔 运动 的 函数 


>>>import turtle forward(distance) | fdl(distance) 
>>>from turtle import * backward (distance) | bk(distance) 
Iback (distance) 
right (angle) | rt(angle) 
控制 画笔 绘制 状态 的 函数 left (angle) | lt(angle) 
pendown () | Ed() | down () setheading (to angle) 
penup () | pu() | up() Position() | pos() 
Pensize(wid ) | width(wid) goto(x,y ) 
setposition(x,y ) | setpos (xy ) 


控制 画笔 颜色 和 字体 函数 circlel(radius,extent ,steps ) 


color () reset () dot (size ,*color) radians () 


begin fill() end fil11'() stamp () speed(speed ) 
filling() clear() clearstamp (stamp id) 

screensize() clearstamps (n ) undo () 
showturtle () | st() speed (speed ) heading() 
hidetuztle() | ht() towards (x,y ) distance (x,y ) 
isvisible() 文 CO ()》 ycor() 
write(arg,move=False,align="]eft" setx (x) sety (Y) 

rfont =("Arial",8,"normal™) ) home () undo() 


degrees (fullcircle = 360.0) 


TurtleScreen/Screen 类 的 函数 
bgcolor (*args) getcanvas () 
bgpic(picname ) getshapes () 
clearscreen () turtles () 
resetscreen () window height () 
screensize (cwid ,canvh,bg ) window width () 
tracer(n ,delay ) bye() 
listen (xdummy ,ydummy ) exitonclick() 
onkey ( (fun, key) title(titlestring) 
onkeyrelease ( (fun, key) setup(wid= CFG["wid"],h= CFG["h"], 


onkeypress (fun,key ) startx= CFGI"leftright"]; 


onscreenclick (fun,btn=1,add ) starty= CFG["topbottom"]) 
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PIL 库 


常用 引入 方式 读 取 ， 创 建 图 像 函数 
>>> from PIL import Image 


Image .open ('ilename jpg') 


处 理 图 片 时 的 常用 属性 


PIL.Image.format PIL. Image.mode 


Image.new (mode, size, color) 


Image.open (StringIO-StringIO (buffer)) 


PIL.Image.palette PIL.Image.size 


TarIO.TazrzIO ("In.tar", "Im.ppm") 


Image.fromarray (obj,mode) 


剪 切 ， 合 并 图 像 函数 
Image.cpoy() Image .crop (box) Image . frombytes (mode size, data) 


Image.paste (im, box, mask) Image.frombuffer (mode, size,data) 


(b, g, Image .verify!() 


Image.merge ("RGB", ry) 


图 形 绘制 函数 获取 数据 函数 


ImageDraw.Draw.line (ixy, fill,width) Image .getdatal() 
ImageDraw.Draw.arc (xy, start,end, fi1]1) Image .getbands () 
ImageDraw.Draw.chord (xy, start,end, fill,outline) Image .getpixel (xy) 
ImageDraw.Draw.bitmap (xy,bitmap, fi11) Image .getcolors (max=256) 
ImageDraw.Draw.ellipse (xy, fill,outline) Image .getextrema() 
ImageDraw.Draw.point (xy;, £i11) Image.getbox() 
ImageDraw.Draw.polygon (xy, fill,outline) Image.histogram (mask) 
ImageDraw.Draw.rectangle (xy, fill,outline) 序列 操作 函数 


ImageDraw.Draw.text (xy, text, fill,font,anchor) Image.seek (frame) 


ImageDraw.Draw.textsize (text, font) Image.tell () 


像素 点 ， 通 道 处 理 函 数 


转换 ， 保 存 图 像 函数 Image. point (lut, mode=None) 
亚 二 芋 习 二 于 ad)" 
ne wa IC ME. Somme Image.eval (im,*args) Image.load!() 
Image.show (title, command) 
Image.split() Image .merge () 
工 让 d Ed =256 
mage.convert (mode,matrix,colors ) Tn .bienal( imL, In2, alpha) 
Image.thumbnail (size,resample=1) en 
Tmages QEaett) Image.alpha composite (iml,im2) 


增强 ， 滤 镜 函 数 


Image.filter(ImageEilter.fuction) 


几何 变换 函数 


Image.resize (size) 


ImageEnhance.enhance (Factor) Image.rotate (angle, resample=0, expand=0) 


ImageEnhance.Color (im) Image.transpose (method) 


ImageBnhance.Contrast (im) Image .transform(size method, data, 
ImageEnhance .Brightness (im) resample, fill) 
” 


ImageEnhance.Sharpness (im) 


常见 引入 形式 
>>>import NumPy as np 


创建 数组 函数 
array ([x,y,z], dtype=int) 


arange (x,y,i) indices (n) 
linspace (x, yn) 
random.rand (m,n) 
Eunction( (m,n).,dtype) 
ones ( (m,n),dtype) 

empty( (m,n),dtype) 


其 他 运算 函数 
.abs (x) np.sqrt (x) 


np 
np. 
np.ceil (x) 
np. 


np. exp (xf[， 


squre (x) np.sign (x) 
np.floor (x) 
out]) 
out]) 


rint (x[i 


np.10og (x) np.10g10 (x) 


np.log2(x) np.1loglp (x) 


矩阵 运算 函数 
np .mat (data, dtype) 


([[A, B], [C, D]] 
np .eye (n) np.dot (a,b 


np.bmat 


np.corrcoef (a,b) np.cov (x 
np.transpose() ndarray.T 
np.diagonal() ndarray.H 


np.trace() ndarray.I 


布尔 运算 与 位 运算 函数 


np.logical and (xl1l, x2[, out]) 
np.logical not (x[, out]) 

np.logical or (xl, x2[, out]) 
np.logical xor (xl, x2[, out]) 
np.bitwise and (xl, x2[, out]) 


np.bitwise not (xl, x2[, out]) 


np.bitwise or (xl, x2[, out]) 


数组 属性 


ndarray.ndim 


ndarray.shape 


ndarray.size 


ndarray.dtype 
ndarray.itemsize 


ndarray.data 


ndarray.flat 


傅 里 叶 变 换 函 数 


fft(a[l, n, 
ifft(al, 
fft2(al, 

届时 | 
Eftn (a[， 
hfft (al, 


三 角 运 算 函 数 
nP.sin(x) 
np.cos (x) 
np.tan (x) 
np.arcsin (x) 
np.arccos (x) 
np.arctan (x) 
np.degree (x) 


np.radians (x 
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numpy 库 


比较 运算 函数 
np.equal (x1, x2 [，Y]) 


np.not equal (xl, x2 [，Y]) 
Y]) 
np.less equal (xI，x2，[，Y]) 
x2, [, y]) 
np.greater equal (xl, x2, [， 


np:less(xl: x2; [， 


np.greater (x1, 


Y]) 
np.where (condition[x,y]) 


算数 运算 函数 


np.add (x1l, x2 [, y]) 
np.subtract (xl, x2 [，Y]) 


np.multiply (xl, x2 [, y]) 


axis]) 
me dB] 
s, axis, np.divide (xl, x2 [, y]) 

np.true divide (xl, x2 [, y]) 


s, axis] np.floor divide (x1l, x2 [, y]) 


n, axis] np.negative(x [,y]) 


np.sum (x[, out]) 


np.mean (a, axis, dtype, out) 
ddof=0) 
daof=0) 


np.ndarray.min/max (axis, out) 


np.std (a, axis; dtype, out, 


np.var (a, axis, dtype, out, 


np.argmin/argmax (a, axis, out) 


cumsum (a, axis, dtype, out) 


cumprod (a, axis, dtype, out) 


形态 操作 函数 
np.reshape (n,m) np.flatten () 


np.swapaxes () np.resizel(a,new_ shape) 


概率 运算 函数 


np.random.normal (n,p,size) 
np.random.lognormal (mean, sigma,N) 
np.random.binomial (n,p,size) 


np.random.hypergeometric (nl,n2,n,size) 
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matplotlib 库 


常见 引入 形式 
>>> import matplotlib.pyplot as plt 


读 取 与 显示 函数 


plt.legend() plt.show!() 
绘图 区 域 函数 plt.matshow() plt.imshow!() 


plt.imsave() plt.imread() 
,figure (figsize=None, facecolor=None) 


.axes (rect,axisbg="'w!) 
.Subplot (nrows, ncols, plot number) 标签 设置 函数 
.Subplots adjust() 


plt.figlegend (handles, label, loc) 
基础 图 表 函 数 


.Polt (x, y,label,color,width) bilegend() 


plt.xlabel (s) 
plt.ylabel (s) 


.boxplot (data, notch,position) 
.bar (left, height, width, bottom) 


3 下 下 ' 下 于 于 
.barh (bottom，width，height，left) Pe stick (erray, "an "bs "ot) 


pilt. yticks(array, "a'y "b', "ey 
plt.clabel (cs,v) 
plt.get figlabels() 


.Polar (theta, r) 
.Piel(data,explode) 


:Psd(x, NFFT=256,pad to,Fs) 
plt.figtext (x,y,s,fontdic) 


plt.title() 
plt.suptitle() 


‘specgram(x, NEFFT=256,pad to,F) 
.Cohere (x, y, NFFT=256, Fs) 


‘Scatter() 


plt.step (x, y, where) plt.text (x,y,Ss,fontdic,withdash) 
时 天 严 


Bt .iat (, bins, nermed) Plt.annotate (note, xy, xytext, 


plit.contour (X, Y, 2, N) xycoords, textcoords,arrowprops) 
. 人 


plt.vlines () 
plt.stem(x, y, linefmt, 


坐标 轴 设 置 函 数 


markerfmt,basefmt) 
plt.plot date() 


plt.plotfilel) :axis'('v'y 'off"', "equal', 


"scaled's; 'tight', "image') 


.Xlim(xmin, xmax) 
填充 函数 .ylim(ymin, ymax) 


plt.fill (x,y,c,color) “xscale() plt.yscale() 


Plt.fill between (x,yl,y2,where,color) "autoscale() 


plt.fill betweenx (y,x1,x2,where,hold) “text (x,y,s, fontdic,withdash) 
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Beautiful Soup 库 


常见 引入 形式 获取 tag 对 和 象 
>>>from bs4 import BeautifulSoup 


>>> tag = soup.head.title 


创建 BeautifulSoup 对 象 >>> tag 


<title>B tiful Sou 
>>> soup = BeautifulSoup (html) bat leshead trin oup 
Documentation 一 Beautiful Soup 


>>> type (soup) 
4.4.0 documentation</title> 


<class 'bs4.BeautifulSoup'> 


BeautifulSoup 对 象 的 常用 属性 Tag 对 象 的 常用 属性 


title Strings stripped strings name attrs contents string 


Tag 中 数据 的 获取 函数 
get (attribute) 
get text() 


查找 tag 的 函数 
Find alll(l name , attrs , recursive ， text , **kwargs ) 


find( name , attrs , recursive , text , **kwargs ) 


Requests 库 


常见 引入 形式 常用 属性 
>>>import requests requests.status code 
requests.text 


各 种 请 求 方式 函数 requests .encoding 


requests.get (Drl) requests.content 


requests.raw 


requests.post (url, data = {'key': 'value'}) 


requests.delete (url) 
requests.head (url) 常用 函数 
requests.options (url) regquests ,json() 


requests.put (url, data = {'key': 'value'}) requests.raise for status () 
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